Inspiration

ทางกลุ่มของพวกเราเกิดการรวมกลุ่มจากการเป็นรุ่นพี่และรุ่นน้องของมหาวิทยาลัยมหิดลคณะวิทยาศาสตร์สาขา Industrial Mathematics and Data Sciences ที่มีความสนใจเกี่ยวกับ Machine Learning and Deep Learning ซึ่งได้เห็นการแข่งขัน TMLCC ที่นำความรู้ด้าน ML/DL มาผสมผสานกับเคมี จึงตัดสินใจลงแข่งเพื่อเพิ่มความรู้, ทักษะ และเปิดโลกด้านต่างๆมากขึ้นค่ะ

What it does

เพื่อทำนายผล CO2 working capacity

How we built it

ทางทีมของเราได้แบ่งขั้นตอนออกมาเป็น 3 ขั้นตอนใหญ่ๆค่ะ

  1. เริ่มจากหา features มากที่สุดเท่าที่ทำได้ โดยขั้นตอนนี้เราได้ทำ features เพิ่มขึ้นมา 3 อัน คือ smiles จาก open babel, pore volume และ center of mass จาก pywindow
  2. เป็นส่วนของการprepossing data -Label encoding category data ให้เป็น numerical -MinMaxScalerปรับขนาด ให้อยู่ในช่วง0-1 -One hot smiles ให้อยู่ในรูปแบบ 2D matrix
  3. สร้างโมเดล multi input cnn+nn โมเดลของเราสร้าง input ขึ้นมาสองทาง ก็คือทางที่เป็น 1D data ใช้ nn โมเดล และทางที่เป็น 2D data เราใช้ cnn และนำ concatenate กันค่ะ และใช้ NN อีกที เพื่อนำมาเป็นผลสุดท้าย โดยระหว่าง node เรามีการใช้ dropout ที่ 20%, batch normalization และ Leaky ReLu เพื่อเพิ่มประสิทธิภาพของโมเดล

Challenges we ran into

สิ่งที่ยากที่สุดคือการเข้าใจโครงสร้างของ MOF และใช้ library ทางด้าน chemistry

Accomplishments that we're proud of

สามารถนำสิ่งที่เรียนในมหาวิทยาลัยมาประยุกต์ใช้กับงานทางแขนงอื่นอย่างด้านเคมีได้ค่ะ

What we learned

ความสำคัญของ features ต่างๆ และวิธีการ clean data ส่งผลต่อความแม่นยำของโมเดลมากค่ะ

What's next for WanChem

ทางทีมอยากลองใช้โมเดล กับโครงสร้างMOF 2D และ 3D แทน one hot smiles ค่ะ เพื่อเพิ่มการเรียนรู้ของโมเดล

Built With

+ 25 more
Share this project:

Updates