- Business Understanding ต้องการทำ Machine Learning เพื่อสร้างโมเดลทำนาย ความสามารถในการดูดซับก๊าซของ Metal-Organic Frameworks (MOFs)
- Data Understanding ทำความเข้าใจความหมายของ Feature (x) ที่ส่งผลต่อค่า CO2 Working Capacity (y)
- Data Preparation
- ทำความสะอาดข้อมูล เช่นการ แทนที่ 0 ด้วยการคำนวณ void_fraction = density*void_volume Void_volume = void_fraction /density แทนค่า Surface_Area <= 0 ด้วยการใช้ Function หา GSA แล้วหารด้วย Density
- Drop ค่า 0, missing และ Infinity ที่หาค่ามาแทนไม่ได้
- ใช้ one hot encoding แปลงข้อมูลประเภท Nominal (functional_groups,Topology) ให้เป็น Binary
- Modelling
- Artificial Neural Network
- xgboost
- Evaluation
- Artificial Neural Network at phase2 error LMAE = 1.371
- xgboost at phase3 (Waiting result)
Library:
- numpy : จัดการ array
- pandas : จัดการ data frame และทำความสะอาดชุดข้อมูล
- matplotlib : พลอตกราฟ
- Tensorflow : ANN model
- sklearn: one hot encoding, train test split
- evalml : หาโมเดล และ hyperparameter
- xgboost: xgboost model
Built With
- jupyter
- python
Log in or sign up for Devpost to join the conversation.