Inspiration
ทางกลุ่มของพวกเราเกิดการรวมกลุ่มจากการเป็นรุ่นพี่และรุ่นน้องของมหาวิทยาลัยมหิดลคณะวิทยาศาสตร์สาขา Industrial Mathematics and Data Sciences ที่มีความสนใจเกี่ยวกับ Machine Learning and Deep Learning ซึ่งได้เห็นการแข่งขัน TMLCC ที่นำความรู้ด้าน ML/DL มาผสมผสานกับเคมี จึงตัดสินใจลงแข่งเพื่อเพิ่มความรู้, ทักษะ และเปิดโลกด้านต่างๆมากขึ้นค่ะ
What it does
เพื่อทำนายผล CO2 working capacity
How we built it
ทางทีมของเราได้แบ่งขั้นตอนออกมาเป็น 3 ขั้นตอนใหญ่ๆค่ะ
- เริ่มจากหา features มากที่สุดเท่าที่ทำได้ โดยขั้นตอนนี้เราได้ทำ features เพิ่มขึ้นมา 3 อัน คือ smiles จาก open babel, pore volume และ center of mass จาก pywindow
- เป็นส่วนของการprepossing data -Label encoding category data ให้เป็น numerical -MinMaxScalerปรับขนาด ให้อยู่ในช่วง0-1 -One hot smiles ให้อยู่ในรูปแบบ 2D matrix
- สร้างโมเดล multi input cnn+nn โมเดลของเราสร้าง input ขึ้นมาสองทาง ก็คือทางที่เป็น 1D data ใช้ nn โมเดล และทางที่เป็น 2D data เราใช้ cnn และนำ concatenate กันค่ะ และใช้ NN อีกที เพื่อนำมาเป็นผลสุดท้าย โดยระหว่าง node เรามีการใช้ dropout ที่ 20%, batch normalization และ Leaky ReLu เพื่อเพิ่มประสิทธิภาพของโมเดล
Challenges we ran into
สิ่งที่ยากที่สุดคือการเข้าใจโครงสร้างของ MOF และใช้ library ทางด้าน chemistry
Accomplishments that we're proud of
สามารถนำสิ่งที่เรียนในมหาวิทยาลัยมาประยุกต์ใช้กับงานทางแขนงอื่นอย่างด้านเคมีได้ค่ะ
What we learned
ความสำคัญของ features ต่างๆ และวิธีการ clean data ส่งผลต่อความแม่นยำของโมเดลมากค่ะ
What's next for WanChem
ทางทีมอยากลองใช้โมเดล กับโครงสร้างMOF 2D และ 3D แทน one hot smiles ค่ะ เพื่อเพิ่มการเรียนรู้ของโมเดล
Log in or sign up for Devpost to join the conversation.