ตัวอย่างการอธิบายผลงาน

Inspiration

ทีมของเราได้มีความสนใจในการแข่งขัน TMLCC ซึ่งโจทย์ในปีนี้คือการทำนายความสามารถในการดูดซับก๊าซของ Metal-Organic Frameworks (MOFs)

What it does

Machine learning model ของเราใช้เทคนิค Kernel-Ridge Regression (KRR) ในการทำนายค่า working capacity ของ MOF ใน test set ซึ่งมีทั้งหมด 17,000 ตัว โดยเรียนรู้จาก descriptor ที่เป็นคุณสมบัติเชิงกายภาพของโครงสร้าง MOF เช่น ปริมาตร พื้นที่ผิว โดยชุดข้อมูลฝึกสอนมีประมาณหกหมื่นกว่าโครงสร้าง

นอกจากนี้ เรายังได้ใช้เทคนิค cross-validation ในการศึกษาความสามารตของโมเดลในการทำนายชุดข้อมูล validation set อีกด้วย

How we built it

เราใช้ภาษา Python 3 ในการเขียนโปรแกรมทั้งหมด เราใช้ libraries ต่อไปนี้ด้วย

  • numpy : จัดการ array
  • pandas : จัดการ data frame และทำความสะอาดชุดข้อมูล
  • scikit-learn : KRR model
  • matplotlib : พลอตกราฟ

เรายังได้ใช้ GPU machine ของ Deepnote ในการเทรนโมเดลอีกด้วย ซึ่ง Deepnote คือ data science platform ที่เอาไว้ใช้สำหรับการเขียนโปรแกรมภาษา Python แบบที่เป็น cell ซึ่งเป็น Jupyter-based notebook

Challenges we ran into

  • มีข้อมูลบางอันที่มีปัญหาในชุดข้อมูลที่ให้มา แต่เราก็สามารถทำความสะอาดชุดข้อมูลได้

Accomplishments that we're proud of

  • โมเดลของเราสามารถทำนายค่า WC ได้อย่างมีประสิทธิภาพยอดเยี่ยม โดยโมเดลที่ดีที่สุดมีค่า error LMAE อยู่ที่ 1.55284551054

What we learned

  • เราได้เรียนรู้ความสำคัญของ MOF และการประยุกต์ใช้ machine learning ในการทำนายหาคุณสมบัติทางเคมีของ MOF
  • ได้แก้ปัญหาโจทย์ที่ไม่เคยทำมาก่อน
  • เรียนรู้สิ่ง ๆ ใหม่ ๆ จากวิทยากร
  • ได้เข้าร่วมการแข่งขัน Data science สำหรับวิทยาศาสตร์ที่จัดขึ้นมาเป็นครั้งแรก

สำหรับรายละเอียดเพิ่มเติม ผู้เข้าแข่งขันสามารถดูได้ที่วิดีโอต่อไปนี้ https://www.youtube.com/watch?v=-qMudqHLZBU

Built With

Share this project:

Updates