Sakana AI Memperkenalkan Agen Peningkatan Diri yang Meningkatkan Performa Hingga 50% di SWE-Bench
Singkatnya Sakana AI meluncurkan Darwin Gödel Machine, agen peningkatan mandiri yang meningkatkan kinerja hingga 50.0% pada SWE-bench dan hingga 30.7% pada Polyglot.
Perusahaan AI Jepang Sakana AI memperkenalkan Darwin Gödel Machine (DGM), agen yang dapat memodifikasi dirinya sendiri dan mampu mengubah kodenya sendiri. Dengan mengambil inspirasi dari prinsip evolusi, sistem ini mempertahankan garis keturunan varian agen yang terus berkembang, sehingga memungkinkan eksplorasi berkelanjutan dalam berbagai desain agen yang dapat meningkatkan dirinya sendiri.
Sementara sistem agen saat ini biasanya statis dan tidak berubah setelah penerapan, DGM menekankan peningkatan diri secara berkelanjutan sebagai faktor penting untuk memajukan kemampuan AI. Mesin ini dirancang untuk mendukung sistem AI yang dapat mempelajari dan mengembangkan kemampuannya dari waktu ke waktu, mirip dengan pengembangan manusia.
DGM merupakan kemajuan penting menuju sistem AI yang mampu mengidentifikasi dan membangun tonggak pembelajaran mereka sendiri secara mandiri untuk terus berinovasi. Sistem ini memperluas arsipnya dengan memilih agen dari koleksi yang ada dan menggunakan model dasar untuk menghasilkan varian baru yang lebih baik dari agen tersebut. Proses eksplorasi terbuka ini menciptakan pohon yang terus berkembang dari agen yang beragam dan berkualitas tinggi, yang memungkinkan eksplorasi simultan dari beberapa jalur dalam ruang pencarian.
Hasil empiris menunjukkan bahwa DGM meningkatkan kemampuan pengkodeannya dari waktu ke waktu—menyempurnakan alat seperti penyuntingan kode, manajemen konteks panjang, dan mekanisme tinjauan sejawat—yang menghasilkan peningkatan kinerja pada tolok ukur seperti SWE-bench (dari 20.0% menjadi 50.0%) dan Polyglot (dari 14.2% menjadi 30.7%). Sistem ini secara konsisten mengungguli model dasar yang tidak memiliki kemampuan perbaikan mandiri atau eksplorasi terbuka.
Perlu dicatat, evolusi menuju agen yang paling efektif terkadang melibatkan perantara agen yang berkinerja lebih buruk daripada pendahulunya tetapi tetap dipertahankan dalam garis keturunan, yang menggambarkan keuntungan dari strategi pencarian terbuka. Pendekatan ini mempertahankan arsip beragam agen perantara yang berguna daripada hanya berfokus pada percabangan dari agen dengan kinerja tertinggi, yang menunjukkan bahwa kemajuan tidak selalu mengikuti jalur linier.
Penelitian lebih lanjut menunjukkan bahwa peningkatan kinerja agen yang ditemukan oleh DGM dapat digeneralisasikan ke berbagai model fondasi, seperti transfer dari Claude ke o3-mini, dan ke berbagai bahasa pemrograman dan domain tugas, termasuk Python, Rust, C++, Go, dan lainnya.
Sakana AI: Mengembangkan Sistem AI yang Terinspirasi Oleh Alam dan Kecerdasan Kolektif
Sakana AI adalah perusahaan riset AI yang berpusat di Tokyo yang berfokus pada pengembangan sistem AI yang terinspirasi oleh proses alami. Pendekatan perusahaan ini melibatkan pengintegrasian beberapa model otonom yang lebih kecil untuk membentuk kecerdasan kolektif, mirip dengan cara kerja sekumpulan ikan. Metode ini berbeda dari model AI skala besar tradisional dengan memprioritaskan kemampuan beradaptasi, efisiensi sumber daya, dan keberlanjutan jangka panjang.
Di antara proyek penelitian Sakana AI adalah teknik “Evolutionary Model Merge”, yang menerapkan algoritma evolusi untuk menggabungkan model AI yang ada. Proses ini menghasilkan model baru dengan kemampuan yang ditargetkan sambil meminimalkan kebutuhan daya komputasi yang besar. Selain itu, Sakana AI telah mengembangkan “ Ilmuwan AI ,” sebuah sistem yang dirancang untuk mengotomatiskan penelitian ilmiah dengan memungkinkan model dasar untuk secara mandiri melakukan investigasi dan proses penemuan.
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Hong Kong izinkan staking kripto untuk platform berlisensi dan ETF seiring persaingan global semakin memanas
Ringkasan Cepat FSC Hong Kong merilis panduan pada hari Senin untuk VATP dan ETF berlisensi yang ingin menawarkan layanan staking. Panduan staking ini merupakan bagian dari peta jalan kripto terbaru Hong Kong.

Pasar stablecoin AS bisa melampaui proyeksi $2 triliun pada akhir 2028 menurut Menteri Keuangan Bessent
Ringkasan Cepat Bessent menyatakan dalam sebuah sidang Senat bahwa pasar stablecoin dolar AS diperkirakan akan melampaui $2 triliun pada tahun 2028, asalkan ada dukungan legislatif. Pada hari Rabu, Senat AS memberikan suara untuk melanjutkan RUU stablecoin GENIUS, membawa RUU tersebut semakin dekat ke tahap pemungutan suara akhir.

ETF Ethereum Spot menarik dana sebesar $240 juta, melampaui arus masuk harian ETF Bitcoin sebesar $164 juta
Ringkasan Singkat ETF ETH spot di AS mencatat arus masuk bersih total sebesar $240 juta pada hari Rabu, melampaui arus masuk ke ETF BTC. Hari Rabu menandai hari ke-18 berturut-turut arus masuk bersih bagi ETF ETH. Analis mengaitkan arus masuk ini dengan diskusi regulasi yang positif terkait DeFi dan stablecoin, serta efek limpahan dari bitcoin.

Plasma menggandakan batas depositnya, menegaskan tengah membidik penjualan publik senilai $50 juta dengan valuasi penuh $500 juta
Pengguna yang menyetorkan stablecoin ke dalam vault Plasma dapat memperoleh hak untuk membeli token Plasma, XPL. Perusahaan menyatakan bahwa mereka menaikkan batas setoran untuk memberikan kesempatan lagi kepada anggota komunitas yang melewatkan pembukaan pertama.

Berita trending
LainnyaHarga kripto
Lainnya








