ตัวอย่างการอธิบายผลงาน
Inspiration
ทีมของเราได้มีความสนใจในการแข่งขัน TMLCC ซึ่งโจทย์ในปีนี้คือการทำนายความสามารถในการดูดซับก๊าซของ Metal-Organic Frameworks (MOFs)
What it does
Machine learning model ของเราใช้เทคนิค Kernel-Ridge Regression (KRR) ในการทำนายค่า working capacity ของ MOF ใน test set ซึ่งมีทั้งหมด 17,000 ตัว โดยเรียนรู้จาก descriptor ที่เป็นคุณสมบัติเชิงกายภาพของโครงสร้าง MOF เช่น ปริมาตร พื้นที่ผิว โดยชุดข้อมูลฝึกสอนมีประมาณหกหมื่นกว่าโครงสร้าง
นอกจากนี้ เรายังได้ใช้เทคนิค cross-validation ในการศึกษาความสามารตของโมเดลในการทำนายชุดข้อมูล validation set อีกด้วย
How we built it
เราใช้ภาษา Python 3 ในการเขียนโปรแกรมทั้งหมด เราใช้ libraries ต่อไปนี้ด้วย
- numpy : จัดการ array
- pandas : จัดการ data frame และทำความสะอาดชุดข้อมูล
- scikit-learn : KRR model
- matplotlib : พลอตกราฟ
เรายังได้ใช้ GPU machine ของ Deepnote ในการเทรนโมเดลอีกด้วย ซึ่ง Deepnote คือ data science platform ที่เอาไว้ใช้สำหรับการเขียนโปรแกรมภาษา Python แบบที่เป็น cell ซึ่งเป็น Jupyter-based notebook
Challenges we ran into
- มีข้อมูลบางอันที่มีปัญหาในชุดข้อมูลที่ให้มา แต่เราก็สามารถทำความสะอาดชุดข้อมูลได้
Accomplishments that we're proud of
- โมเดลของเราสามารถทำนายค่า WC ได้อย่างมีประสิทธิภาพยอดเยี่ยม โดยโมเดลที่ดีที่สุดมีค่า error LMAE อยู่ที่ 1.55284551054
What we learned
- เราได้เรียนรู้ความสำคัญของ MOF และการประยุกต์ใช้ machine learning ในการทำนายหาคุณสมบัติทางเคมีของ MOF
- ได้แก้ปัญหาโจทย์ที่ไม่เคยทำมาก่อน
- เรียนรู้สิ่ง ๆ ใหม่ ๆ จากวิทยากร
- ได้เข้าร่วมการแข่งขัน Data science สำหรับวิทยาศาสตร์ที่จัดขึ้นมาเป็นครั้งแรก
สำหรับรายละเอียดเพิ่มเติม ผู้เข้าแข่งขันสามารถดูได้ที่วิดีโอต่อไปนี้ https://www.youtube.com/watch?v=-qMudqHLZBU
Built With
- deepnote
- gpu
- matplotlib
- numpy
- pandas
- python
- scikit-learn
Log in or sign up for Devpost to join the conversation.