Autonomous Research Agent (ARA)

Front_end-web-chat
Multi-Agent-Flowchart
Agent-Tools_detail

Inspiration

Inspirasi utama proyek ini lahir dari realitas akademis di MBC Laboratory, Universitas Telkom. Kami mengamati bahwa banyak mahasiswa tingkat akhir menghabiskan sebagian besar waktu riset mereka untuk pekerjaan administratif dan repetitif, seperti mencari literatur yang relevan, memvalidasi ketersediaan dataset, hingga melakukan trial-and-error pada tahap awal eksperimen Machine Learning. Di sisi lain, dosen pembimbing juga menghadapi tekanan publikasi ilmiah dengan waktu bimbingan teknis yang terbatas.

Berangkat dari permasalahan tersebut, Autonomous Research Agent (ARA) dikembangkan sebagai sistem AI berbasis multi-agent yang mampu mengotomatisasi alur kerja riset secara end-to-end. Tujuannya adalah mendemokratisasi proses penelitian sehingga peneliti dapat lebih fokus pada inovasi, eksplorasi ide, dan pengembangan solusi nyata, bukan terjebak dalam pekerjaan teknis yang berulang.

What it does

Autonomous Research Agent (ARA) adalah sistem Multi-Agent otonom yang dirancang untuk membantu proses penelitian ilmiah secara menyeluruh hanya dari satu input topik riset.

Setelah pengguna memasukkan topik penelitian, sistem akan secara otomatis:

Melakukan studi literatur dan mencari publikasi ilmiah terbaru menggunakan SerpAPI dan Google Scholar.
Mencari, memvalidasi, dan memilih dataset nyata melalui Kaggle API untuk mencegah penggunaan data fiktif atau halusinasi AI.
Menganalisis kecocokan dataset terhadap topik penelitian.
Melakukan simulasi pelatihan model Machine Learning secara mandiri.
Mengevaluasi performa model menggunakan metrik evaluasi yang relevan.
Menyusun draf awal laporan penelitian dalam format Markdown/LaTeX.
Melakukan self-correction melalui autonomous loop apabila hasil eksperimen belum memenuhi threshold performa yang ditentukan.

Sistem ini bekerja layaknya asisten riset virtual yang dapat melakukan reasoning, pengambilan keputusan, validasi data, dan iterasi eksperimen tanpa intervensi manusia secara terus-menerus.

How we built it

ARA dibangun menggunakan arsitektur Supervisor-Worker Multi-Agent System dengan fokus pada orchestration, reasoning, dan autonomous workflow.

Kami menggunakan LangGraph sebagai orkestrator utama untuk membangun state machine dan mengatur komunikasi antar-agent. Setiap agent memiliki tanggung jawab spesifik seperti literature research, dataset validation, experimentation, dan report generation.

LangGraph digunakan untuk mengelola shared state antar-agent sehingga setiap agent dapat berbagi konteks, hasil eksperimen, dan histori keputusan secara real-time. Dengan pendekatan ini, sistem mampu melakukan reasoning berkelanjutan dan autonomous iteration.

ARA memanfaatkan Gemini 2.5 Pro sebagai reasoning engine utama. Model ini bertindak sebagai supervisor agent yang bertugas:

Menganalisis kebutuhan riset
Mengambil keputusan strategis
Menentukan langkah berikutnya
Mengontrol workflow antar-agent
Melakukan self-evaluation terhadap hasil eksperimen

Backend sistem dibangun menggunakan FastAPI untuk menyediakan API yang scalable, lightweight, dan production-ready.

Untuk memastikan sistem tetap terhubung dengan data dunia nyata, kami mengintegrasikan:

Kaggle API untuk validasi dan pencarian dataset nyata
SerpAPI untuk akses pencarian publikasi ilmiah dan Google Scholar
Python ML ecosystem untuk simulasi training dan evaluasi model

Salah satu fitur utama ARA adalah kemampuan autonomous loop. Jika hasil eksperimen belum memenuhi target akurasi atau dataset tidak sesuai, supervisor agent akan:

Mengevaluasi penyebab kegagalan
Melakukan re-search dataset atau metode
Menjalankan eksperimen ulang
Membandingkan hasil terbaru
Mengulangi proses hingga mencapai kondisi optimal

Challenges we ran into

Tantangan terbesar dalam pengembangan ARA adalah menghadapi fenomena yang kami sebut sebagai “The Hallucination Wall.”

Pada tahap awal pengembangan, model AI sering kali:

Merekomendasikan dataset yang tidak benar-benar ada
Menghasilkan referensi penelitian yang tidak valid
Memberikan metode eksperimen yang tidak realistis
Membuat asumsi teknis tanpa validasi nyata

Untuk mengatasi masalah tersebut, kami membangun mekanisme validasi berbasis tool-call nyata menggunakan Kaggle API sebagai mandatory validator. Dengan pendekatan ini, setiap dataset yang digunakan harus benar-benar tersedia dan dapat diverifikasi secara langsung.

Selain itu, tantangan lain muncul pada desain Conditional Edge di LangGraph. Karena sistem memiliki autonomous loop, kami harus memastikan workflow tidak terjebak dalam infinite loop ketika model terus gagal mencapai target performa.

Kami menyelesaikan masalah ini dengan:

Threshold iteration limit
Prompt engineering yang lebih presisi
Conditional reasoning berbasis evaluasi metrik
Decision checkpoint antar-agent

Accomplishments that we're proud of

Sebagai solo developer, saya berhasil membangun sistem multi-agent yang functional dan end-to-end dalam waktu kurang dari 12 jam selama hackathon berlangsung.

Pencapaian yang paling saya banggakan adalah keberhasilan ARA dalam melakukan:

Self-correction secara mandiri
Dynamic decision making
Autonomous iteration tanpa intervensi manusia
Dataset validation berbasis real-world API
Multi-agent collaboration dengan shared memory

Ketika dataset tidak ditemukan atau hasil eksperimen memiliki performa rendah, sistem mampu melakukan reasoning ulang, mencari alternatif solusi, dan mengulang workflow penelitian secara otomatis.

Hal ini membuat ARA tidak hanya menjadi chatbot AI biasa, tetapi sebuah autonomous research workflow system yang benar-benar dapat membantu proses penelitian teknis.

What we learned

Melalui pengembangan ARA, saya mempelajari bahwa masa depan AI bukan lagi sekadar conversational chatbot, tetapi mengarah pada Agentic AI Workflow yang mampu mengambil keputusan dan menyelesaikan tugas kompleks secara mandiri.

Saya juga mempelajari:

Cara membangun orchestration multi-agent menggunakan shared state
Dynamic tool-calling untuk validasi dunia nyata
Workflow engineering menggunakan state machine
Prompt engineering untuk autonomous reasoning
Teknik mengontrol loop dan decision flow pada sistem agentic

Selain aspek teknis, proyek ini juga mengajarkan pentingnya reliability dan grounding dalam sistem AI. Model yang cerdas saja tidak cukup; AI juga harus mampu memverifikasi informasi sebelum mengambil keputusan.

What's next for Autonomous Research Agent (ARA)

Ke depan, kami ingin mengembangkan ARA menjadi platform riset otonom yang lebih advanced dan multi-modal.

Roadmap pengembangan berikutnya meliputi:

-Multi-modal Research Understanding ARA akan mampu membaca dan mengekstraksi informasi langsung dari:

PDF paper ilmiah
Tabel penelitian
Grafik eksperimen
Diagram metodologi
Neural Architecture Search (NAS) Kami berencana menambahkan automation untuk Neural Architecture Search sehingga sistem dapat secara mandiri mencari arsitektur Deep Learning terbaik untuk suatu permasalahan.

-OJS & Journal Integration ARA akan diintegrasikan langsung dengan Open Journal System (OJS) untuk memungkinkan:

One-click paper submission
Automatic formatting sesuai template jurnal
Metadata generation
Citation management

-Advanced Experimentation Kami juga ingin menambahkan:

Hyperparameter optimization
Distributed experimentation
Benchmark comparison
Auto-generated visualization & analytics
Long-Term Vision Visi jangka panjang kami adalah menjadikan ARA sebagai “AI Research Companion” yang dapat membantu mahasiswa, peneliti, hingga institusi akademik mempercepat inovasi ilmiah melalui otomasi riset yang cerdas, transparan, dan dapat diverifikasi.

Built With

api
fastapi
gemini-2.5.pro
kaggle
kaggle-api
langchain
langgraph
python
serpapi-google-scholar

Updates

Kasz Syah started this project — May 15, 2026 10:57 AM EDT

Leave feedback in the comments!

Log in or sign up for Devpost to join the conversation.