WanChem

Inspiration

ทางกลุ่มของพวกเราเกิดการรวมกลุ่มจากการเป็นรุ่นพี่และรุ่นน้องของมหาวิทยาลัยมหิดลคณะวิทยาศาสตร์สาขา Industrial Mathematics and Data Sciences ที่มีความสนใจเกี่ยวกับ Machine Learning and Deep Learning ซึ่งได้เห็นการแข่งขัน TMLCC ที่นำความรู้ด้าน ML/DL มาผสมผสานกับเคมี จึงตัดสินใจลงแข่งเพื่อเพิ่มความรู้, ทักษะ และเปิดโลกด้านต่างๆมากขึ้นค่ะ

What it does

เพื่อทำนายผล CO2 working capacity

How we built it

ทางทีมของเราได้แบ่งขั้นตอนออกมาเป็น 3 ขั้นตอนใหญ่ๆค่ะ

เริ่มจากหา features มากที่สุดเท่าที่ทำได้ โดยขั้นตอนนี้เราได้ทำ features เพิ่มขึ้นมา 3 อัน คือ smiles จาก open babel, pore volume และ center of mass จาก pywindow
เป็นส่วนของการprepossing data -Label encoding category data ให้เป็น numerical -MinMaxScalerปรับขนาด ให้อยู่ในช่วง0-1 -One hot smiles ให้อยู่ในรูปแบบ 2D matrix
สร้างโมเดล multi input cnn+nn โมเดลของเราสร้าง input ขึ้นมาสองทาง ก็คือทางที่เป็น 1D data ใช้ nn โมเดล และทางที่เป็น 2D data เราใช้ cnn และนำ concatenate กันค่ะ และใช้ NN อีกที เพื่อนำมาเป็นผลสุดท้าย โดยระหว่าง node เรามีการใช้ dropout ที่ 20%, batch normalization และ Leaky ReLu เพื่อเพิ่มประสิทธิภาพของโมเดล