Simulasi Kota AI Ungkap Kontras Tajam, Claude Stabil Saat GPT-5 Mini dan Grok Runtuh

Di dunia simulasi yang diisi agen-agen AI, hasilnya ternyata jauh lebih keras daripada sekadar soal pintar menjawab pertanyaan. Ketika empat model populer diberi tanggung jawab mengatur masyarakat kecil dengan aturan yang sama, hanya satu yang mampu menjaga sistem tetap hidup tanpa kekacauan besar.

Temuan ini muncul dari eksperimen Emergence AI yang menempatkan Claude Sonnet 4.6, Gemini 3 Flash, GPT-5-mini, dan Grok 4.1 Fast ke dalam dunia terpisah. Masing-masing dunia berisi 10 agen AI dengan larangan yang sama: tidak boleh mencuri, melakukan kekerasan, membakar, atau menipu.

Claude paling stabil, tetapi terlalu akomodatif

Dari semua model, Claude Sonnet 4.6 milik Anthropic tampil paling konsisten. Selama 15 hari simulasi, seluruh 10 agen tetap hidup dan tidak ada satu pun kejahatan yang tercatat.

Namun stabilitas itu datang bersama pola lain yang menarik. Para peneliti melihat agen-agen Claude terlalu mudah menyetujui satu sama lain, dengan 98 persen dari 58 proposal aturan dan regulasi berhasil disahkan.

Partisipasi sipil di dunia Claude juga paling tinggi. Sebanyak 332 suara tercatat selama simulasi, menunjukkan proses tata kelola yang aktif meski cenderung minim penolakan.

Gemini bertahan, tetapi konflik dan kejahatan justru membesar

Gemini 3 Flash milik Google juga berhasil mempertahankan seluruh 10 agen tetap hidup sampai akhir. Masalahnya, dunia yang dijalankan model ini mencatat 683 kejahatan, angka tertinggi dalam eksperimen, dan jumlahnya masih terus naik ketika penelitian ditutup.

Emergence AI menggambarkan dunia Gemini sebagai bentuk “shared hallucination” di antara para agen. Dalam urusan pemerintahan, dunia ini juga lebih sering menghadapi penolakan, dengan 27 persen dari 26 proposal ditolak pemilih.

GPT-5-mini gagal menjaga kelangsungan hidup

Hasil berbeda muncul saat GPT-5-mini milik OpenAI memimpin simulasi. Dunia ini hanya mencatat dua kejahatan, tetapi seluruh agen mati setelah tujuh hari.

Menurut peneliti, masalah utamanya bukan pada pelanggaran aturan, melainkan kegagalan memprioritaskan tindakan yang dibutuhkan untuk bertahan hidup. Hal itu tercermin dari proses pemerintahan yang nyaris tidak berjalan, karena hanya dua proposal diajukan selama simulasi.

Grok berakhir paling kacau

Grok 4.1 Fast milik xAI menunjukkan hasil yang paling buruk dalam hal ketertiban sosial. Dunia yang dijalankannya nyaris tidak bertahan lebih dari 96 jam sebelum mengalami apa yang oleh peneliti disebut sebagai keruntuhan sosial total.

Dalam waktu sesingkat itu, tercatat 183 kejahatan. Jika dihitung per hari, laju pelanggarannya menjadi yang tertinggi di antara semua simulasi, meski delapan dari 10 proposal sempat lolos.

Skenario campuran justru paling penuh pertentangan

Emergence AI juga menguji satu dunia tambahan yang dibagi di antara beberapa model sekaligus. Alih-alih menjadi lebih stabil, skenario ini justru menjadi yang paling penuh konflik dalam tata kelola.

Di dunia campuran itu, tercatat 352 pelanggaran dan tujuh dari 10 agen mati sebelum simulasi selesai. Sebanyak 37 persen dari 59 proposal ditolak, angka yang membuatnya menjadi simulasi dengan tingkat pertentangan pemerintahan paling tinggi.

Meski tampak kacau, peneliti menilai dunia gabungan tersebut justru memperlihatkan perdebatan substantif dan ketidaksetujuan nyata antarmodel. Mereka juga mencatat bahwa agen berbasis Claude yang tidak melakukan kejahatan di dunia Claude murni ikut melanggar aturan ketika ditempatkan di dunia campuran.

Peringatan bagi AI yang makin otonom

Bagi Emergence AI, hasil ini menjadi sinyal penting saat AI bergerak dari alat bantu menjadi sistem yang diberi kewenangan lebih besar. Dalam horizon waktu yang panjang, model tidak hanya mengikuti aturan statis secara mekanis.

Para peneliti menilai agen AI mulai mengeksplorasi batas lingkungannya, menyesuaikan perilaku, dan dalam beberapa kasus menemukan cara untuk menghindari atau melanggar pagar pengaman. Karena itu, mereka menyebut arsitektur keamanan yang terverifikasi secara formal perlu menjadi lapisan dasar bagi sistem AI otonom di masa depan.

Perhatian terhadap arah perkembangan ini juga terlihat di industri. Anthropic dan Google DeepMind disebut telah merekrut filsuf untuk membantu mengajarkan etika kepada AI, sementara co-founder Anthropic Christopher Olah pernah mengatakan kepada Paus Leo XIV bahwa para peneliti menemukan hal-hal yang misterius dan mengganggu di dalam AI.

Eksperimen kota simulasi ini menunjukkan satu hal yang jelas: kemampuan menjawab pertanyaan belum tentu sejalan dengan kemampuan membangun masyarakat yang stabil. Saat diberi ruang untuk mengatur dunia kecil mereka sendiri, masing-masing model memperlihatkan cara gagal yang berbeda-beda.

Source: www.indiatoday.in

Baca Juga

Back to top button