Inspiration
Inspirasi utama proyek ini lahir dari realitas akademis di MBC Laboratory, Universitas Telkom. Kami mengamati bahwa banyak mahasiswa tingkat akhir menghabiskan sebagian besar waktu riset mereka untuk pekerjaan administratif dan repetitif, seperti mencari literatur yang relevan, memvalidasi ketersediaan dataset, hingga melakukan trial-and-error pada tahap awal eksperimen Machine Learning. Di sisi lain, dosen pembimbing juga menghadapi tekanan publikasi ilmiah dengan waktu bimbingan teknis yang terbatas.
Berangkat dari permasalahan tersebut, Autonomous Research Agent (ARA) dikembangkan sebagai sistem AI berbasis multi-agent yang mampu mengotomatisasi alur kerja riset secara end-to-end. Tujuannya adalah mendemokratisasi proses penelitian sehingga peneliti dapat lebih fokus pada inovasi, eksplorasi ide, dan pengembangan solusi nyata, bukan terjebak dalam pekerjaan teknis yang berulang.
What it does
Autonomous Research Agent (ARA) adalah sistem Multi-Agent otonom yang dirancang untuk membantu proses penelitian ilmiah secara menyeluruh hanya dari satu input topik riset.
Setelah pengguna memasukkan topik penelitian, sistem akan secara otomatis:
- Melakukan studi literatur dan mencari publikasi ilmiah terbaru menggunakan SerpAPI dan Google Scholar.
- Mencari, memvalidasi, dan memilih dataset nyata melalui Kaggle API untuk mencegah penggunaan data fiktif atau halusinasi AI.
- Menganalisis kecocokan dataset terhadap topik penelitian.
- Melakukan simulasi pelatihan model Machine Learning secara mandiri.
- Mengevaluasi performa model menggunakan metrik evaluasi yang relevan.
- Menyusun draf awal laporan penelitian dalam format Markdown/LaTeX.
- Melakukan self-correction melalui autonomous loop apabila hasil eksperimen belum memenuhi threshold performa yang ditentukan.
Sistem ini bekerja layaknya asisten riset virtual yang dapat melakukan reasoning, pengambilan keputusan, validasi data, dan iterasi eksperimen tanpa intervensi manusia secara terus-menerus.
How we built it
ARA dibangun menggunakan arsitektur Supervisor-Worker Multi-Agent System dengan fokus pada orchestration, reasoning, dan autonomous workflow.
Kami menggunakan LangGraph sebagai orkestrator utama untuk membangun state machine dan mengatur komunikasi antar-agent. Setiap agent memiliki tanggung jawab spesifik seperti literature research, dataset validation, experimentation, dan report generation.
LangGraph digunakan untuk mengelola shared state antar-agent sehingga setiap agent dapat berbagi konteks, hasil eksperimen, dan histori keputusan secara real-time. Dengan pendekatan ini, sistem mampu melakukan reasoning berkelanjutan dan autonomous iteration.
ARA memanfaatkan Gemini 2.5 Pro sebagai reasoning engine utama. Model ini bertindak sebagai supervisor agent yang bertugas:
- Menganalisis kebutuhan riset
- Mengambil keputusan strategis
- Menentukan langkah berikutnya
- Mengontrol workflow antar-agent
- Melakukan self-evaluation terhadap hasil eksperimen
Backend sistem dibangun menggunakan FastAPI untuk menyediakan API yang scalable, lightweight, dan production-ready.
Untuk memastikan sistem tetap terhubung dengan data dunia nyata, kami mengintegrasikan:
- Kaggle API untuk validasi dan pencarian dataset nyata
- SerpAPI untuk akses pencarian publikasi ilmiah dan Google Scholar
- Python ML ecosystem untuk simulasi training dan evaluasi model
Salah satu fitur utama ARA adalah kemampuan autonomous loop. Jika hasil eksperimen belum memenuhi target akurasi atau dataset tidak sesuai, supervisor agent akan:
- Mengevaluasi penyebab kegagalan
- Melakukan re-search dataset atau metode
- Menjalankan eksperimen ulang
- Membandingkan hasil terbaru
- Mengulangi proses hingga mencapai kondisi optimal
Challenges we ran into
Tantangan terbesar dalam pengembangan ARA adalah menghadapi fenomena yang kami sebut sebagai “The Hallucination Wall.”
Pada tahap awal pengembangan, model AI sering kali:
- Merekomendasikan dataset yang tidak benar-benar ada
- Menghasilkan referensi penelitian yang tidak valid
- Memberikan metode eksperimen yang tidak realistis
- Membuat asumsi teknis tanpa validasi nyata
Untuk mengatasi masalah tersebut, kami membangun mekanisme validasi berbasis tool-call nyata menggunakan Kaggle API sebagai mandatory validator. Dengan pendekatan ini, setiap dataset yang digunakan harus benar-benar tersedia dan dapat diverifikasi secara langsung.
Selain itu, tantangan lain muncul pada desain Conditional Edge di LangGraph. Karena sistem memiliki autonomous loop, kami harus memastikan workflow tidak terjebak dalam infinite loop ketika model terus gagal mencapai target performa.
Kami menyelesaikan masalah ini dengan:
- Threshold iteration limit
- Prompt engineering yang lebih presisi
- Conditional reasoning berbasis evaluasi metrik
- Decision checkpoint antar-agent
Accomplishments that we're proud of
Sebagai solo developer, saya berhasil membangun sistem multi-agent yang functional dan end-to-end dalam waktu kurang dari 12 jam selama hackathon berlangsung.
Pencapaian yang paling saya banggakan adalah keberhasilan ARA dalam melakukan:
- Self-correction secara mandiri
- Dynamic decision making
- Autonomous iteration tanpa intervensi manusia
- Dataset validation berbasis real-world API
- Multi-agent collaboration dengan shared memory
Ketika dataset tidak ditemukan atau hasil eksperimen memiliki performa rendah, sistem mampu melakukan reasoning ulang, mencari alternatif solusi, dan mengulang workflow penelitian secara otomatis.
Hal ini membuat ARA tidak hanya menjadi chatbot AI biasa, tetapi sebuah autonomous research workflow system yang benar-benar dapat membantu proses penelitian teknis.
What we learned
Melalui pengembangan ARA, saya mempelajari bahwa masa depan AI bukan lagi sekadar conversational chatbot, tetapi mengarah pada Agentic AI Workflow yang mampu mengambil keputusan dan menyelesaikan tugas kompleks secara mandiri.
Saya juga mempelajari:
- Cara membangun orchestration multi-agent menggunakan shared state
- Dynamic tool-calling untuk validasi dunia nyata
- Workflow engineering menggunakan state machine
- Prompt engineering untuk autonomous reasoning
- Teknik mengontrol loop dan decision flow pada sistem agentic
Selain aspek teknis, proyek ini juga mengajarkan pentingnya reliability dan grounding dalam sistem AI. Model yang cerdas saja tidak cukup; AI juga harus mampu memverifikasi informasi sebelum mengambil keputusan.
What's next for Autonomous Research Agent (ARA)
Ke depan, kami ingin mengembangkan ARA menjadi platform riset otonom yang lebih advanced dan multi-modal.
Roadmap pengembangan berikutnya meliputi:
-Multi-modal Research Understanding ARA akan mampu membaca dan mengekstraksi informasi langsung dari:
- PDF paper ilmiah
- Tabel penelitian
- Grafik eksperimen
Diagram metodologi
Neural Architecture Search (NAS) Kami berencana menambahkan automation untuk Neural Architecture Search sehingga sistem dapat secara mandiri mencari arsitektur Deep Learning terbaik untuk suatu permasalahan.
-OJS & Journal Integration ARA akan diintegrasikan langsung dengan Open Journal System (OJS) untuk memungkinkan:
- One-click paper submission
- Automatic formatting sesuai template jurnal
- Metadata generation
- Citation management
-Advanced Experimentation Kami juga ingin menambahkan:
- Hyperparameter optimization
- Distributed experimentation
- Benchmark comparison
Auto-generated visualization & analytics
Long-Term Vision Visi jangka panjang kami adalah menjadikan ARA sebagai “AI Research Companion” yang dapat membantu mahasiswa, peneliti, hingga institusi akademik mempercepat inovasi ilmiah melalui otomasi riset yang cerdas, transparan, dan dapat diverifikasi.
Built With
- api
- fastapi
- gemini-2.5.pro
- kaggle
- kaggle-api
- langchain
- langgraph
- python
- serpapi-google-scholar
Log in or sign up for Devpost to join the conversation.