Bitget App
Trading lebih cerdas
Beli KriptoPasarTradingFuturesBotsEarnCopy
Sakana AI Memperkenalkan Agen Peningkatan Diri yang Meningkatkan Performa Hingga 50% di SWE-Bench

Sakana AI Memperkenalkan Agen Peningkatan Diri yang Meningkatkan Performa Hingga 50% di SWE-Bench

MPOSTMPOST2025/06/04 08:32
Oleh:MPOST

Singkatnya Sakana AI meluncurkan Darwin Gödel Machine, agen peningkatan mandiri yang meningkatkan kinerja hingga 50.0% pada SWE-bench dan hingga 30.7% pada Polyglot.

Perusahaan AI Jepang Sakana AI memperkenalkan Darwin Gödel Machine (DGM), agen yang dapat memodifikasi dirinya sendiri dan mampu mengubah kodenya sendiri. Dengan mengambil inspirasi dari prinsip evolusi, sistem ini mempertahankan garis keturunan varian agen yang terus berkembang, sehingga memungkinkan eksplorasi berkelanjutan dalam berbagai desain agen yang dapat meningkatkan dirinya sendiri.

Sementara sistem agen saat ini biasanya statis dan tidak berubah setelah penerapan, DGM menekankan peningkatan diri secara berkelanjutan sebagai faktor penting untuk memajukan kemampuan AI. Mesin ini dirancang untuk mendukung sistem AI yang dapat mempelajari dan mengembangkan kemampuannya dari waktu ke waktu, mirip dengan pengembangan manusia.

Percobaan kami menunjukkan bahwa Darwin Gödel Machine dapat terus meningkatkan kemampuannya dengan memodifikasi basis kodenya sendiri. Di SWE-bench, DGM secara otomatis meningkatkan kinerjanya dari 20% menjadi 50%.

Gambar di sini menunjukkan kemajuan kinerja selama iterasi, dan juga ringkasan… foto.twitter.com/RjxapMTQN3

— Sakana AI (@SakanaAILabs) 30 Mei 2025

DGM merupakan kemajuan penting menuju sistem AI yang mampu mengidentifikasi dan membangun tonggak pembelajaran mereka sendiri secara mandiri untuk terus berinovasi. Sistem ini memperluas arsipnya dengan memilih agen dari koleksi yang ada dan menggunakan model dasar untuk menghasilkan varian baru yang lebih baik dari agen tersebut. Proses eksplorasi terbuka ini menciptakan pohon yang terus berkembang dari agen yang beragam dan berkualitas tinggi, yang memungkinkan eksplorasi simultan dari beberapa jalur dalam ruang pencarian. 

Hasil empiris menunjukkan bahwa DGM meningkatkan kemampuan pengkodeannya dari waktu ke waktu—menyempurnakan alat seperti penyuntingan kode, manajemen konteks panjang, dan mekanisme tinjauan sejawat—yang menghasilkan peningkatan kinerja pada tolok ukur seperti SWE-bench (dari 20.0% menjadi 50.0%) dan Polyglot (dari 14.2% menjadi 30.7%). Sistem ini secara konsisten mengungguli model dasar yang tidak memiliki kemampuan perbaikan mandiri atau eksplorasi terbuka.

Perlu dicatat, evolusi menuju agen yang paling efektif terkadang melibatkan perantara agen yang berkinerja lebih buruk daripada pendahulunya tetapi tetap dipertahankan dalam garis keturunan, yang menggambarkan keuntungan dari strategi pencarian terbuka. Pendekatan ini mempertahankan arsip beragam agen perantara yang berguna daripada hanya berfokus pada percabangan dari agen dengan kinerja tertinggi, yang menunjukkan bahwa kemajuan tidak selalu mengikuti jalur linier.

Penelitian lebih lanjut menunjukkan bahwa peningkatan kinerja agen yang ditemukan oleh DGM dapat digeneralisasikan ke berbagai model fondasi, seperti transfer dari Claude ke o3-mini, dan ke berbagai bahasa pemrograman dan domain tugas, termasuk Python, Rust, C++, Go, dan lainnya.

Sakana AI: Mengembangkan Sistem AI yang Terinspirasi Oleh Alam dan Kecerdasan Kolektif

Sakana AI adalah perusahaan riset AI yang berpusat di Tokyo yang berfokus pada pengembangan sistem AI yang terinspirasi oleh proses alami. Pendekatan perusahaan ini melibatkan pengintegrasian beberapa model otonom yang lebih kecil untuk membentuk kecerdasan kolektif, mirip dengan cara kerja sekumpulan ikan. Metode ini berbeda dari model AI skala besar tradisional dengan memprioritaskan kemampuan beradaptasi, efisiensi sumber daya, dan keberlanjutan jangka panjang.

Di antara proyek penelitian Sakana AI adalah teknik “Evolutionary Model Merge”, yang menerapkan algoritma evolusi untuk menggabungkan model AI yang ada. Proses ini menghasilkan model baru dengan kemampuan yang ditargetkan sambil meminimalkan kebutuhan daya komputasi yang besar. Selain itu, Sakana AI telah mengembangkan “ Ilmuwan AI ,” sebuah sistem yang dirancang untuk mengotomatiskan penelitian ilmiah dengan memungkinkan model dasar untuk secara mandiri melakukan investigasi dan proses penemuan.

0

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Raih Token Baru
APR hingga 12%. Selalu aktif, selalu dapat airdrop.
Kunci sekarang!

Kamu mungkin juga menyukai

SEC secara resmi membatalkan usulan aturan bursa DeFi dan kustodian era Gary Gensler

Sekilas Cepat SEC AS secara resmi mencabut beberapa usulan aturan pada hari Kamis yang sebelumnya akan memberlakukan regulasi lebih ketat terhadap DeFi dan kustodi kripto. Usulan tersebut diajukan di bawah kepemimpinan mantan Ketua Gary Gensler, yang memimpin pendekatan “regulasi melalui penegakan hukum” di lembaga tersebut.

The Block2025/06/13 12:17
SEC secara resmi membatalkan usulan aturan bursa DeFi dan kustodian era Gary Gensler

Senat AS jadwalkan pemungutan suara final RUU stablecoin GENIUS pada 17 Juni

Sekilas Cepat Senat AS dijadwalkan memberikan suara akhir untuk RUU GENIUS pada hari Selasa mendatang. Jika disetujui oleh Senat, RUU ini akan dilanjutkan ke Dewan Perwakilan Rakyat untuk pemungutan suara lebih lanjut. RUU GENIUS bertujuan untuk membentuk kerangka hukum bagi stablecoin dan penerbitnya.

The Block2025/06/13 12:17
Senat AS jadwalkan pemungutan suara final RUU stablecoin GENIUS pada 17 Juni

Anthony Pompliano dalam pembicaraan untuk memimpin perusahaan publik yang mencari $750 juta untuk membeli Bitcoin menurut FT

Ringkasan Cepat Anthony Pompliano sedang dalam pembicaraan untuk menjabat sebagai CEO di sebuah perusahaan publik yang berencana mengumpulkan dana sebesar $750 juta untuk membeli Bitcoin, menurut laporan Financial Times.

The Block2025/06/13 12:17
Anthony Pompliano dalam pembicaraan untuk memimpin perusahaan publik yang mencari $750 juta untuk membeli Bitcoin menurut FT

GameStop meningkatkan penawaran privat menjadi $2,25 miliar meskipun saham anjlok di tengah rencana treasury bitcoin

GameStop telah meningkatkan penawaran pribadi obligasi konversi seniornya dari $1,75 miliar menjadi $2,25 miliar. Perusahaan berencana menggunakan hasil dari penawaran ini untuk keperluan korporasi umum dan potensi akuisisi yang sejalan dengan kebijakan investasinya.

The Block2025/06/13 12:17
GameStop meningkatkan penawaran privat menjadi $2,25 miliar meskipun saham anjlok di tengah rencana treasury bitcoin