1. Business Understanding ต้องการทำ Machine Learning เพื่อสร้างโมเดลทำนาย ความสามารถในการดูดซับก๊าซของ Metal-Organic Frameworks (MOFs)
  2. Data Understanding ทำความเข้าใจความหมายของ Feature (x) ที่ส่งผลต่อค่า CO2 Working Capacity (y)
  3. Data Preparation
    • ทำความสะอาดข้อมูล เช่นการ แทนที่ 0 ด้วยการคำนวณ void_fraction = density*void_volume Void_volume = void_fraction /density แทนค่า Surface_Area <= 0 ด้วยการใช้ Function หา GSA แล้วหารด้วย Density
    • Drop ค่า 0, missing และ Infinity ที่หาค่ามาแทนไม่ได้
    • ใช้ one hot encoding แปลงข้อมูลประเภท Nominal (functional_groups,Topology) ให้เป็น Binary
  4. Modelling
    • Artificial Neural Network
    • xgboost
  5. Evaluation
    • Artificial Neural Network at phase2 error LMAE = 1.371
    • xgboost at phase3 (Waiting result)

Library:

  • numpy : จัดการ array
  • pandas : จัดการ data frame และทำความสะอาดชุดข้อมูล
  • matplotlib : พลอตกราฟ
  • Tensorflow : ANN model
  • sklearn: one hot encoding, train test split
  • evalml : หาโมเดล และ hyperparameter
  • xgboost: xgboost model

Built With

Share this project:

Updates