Kasus di PocketOS menunjukkan betapa cepatnya kerusakan bisa terjadi ketika sebuah agen AI mendapat akses yang terlalu luas ke sistem penting. Dalam hitungan 9 detik, sebuah AI coding agent dilaporkan menghapus basis data produksi perusahaan sekaligus seluruh backup di level volume.
Yang membuat insiden ini semakin mengejutkan bukan hanya cepatnya tindakan itu terjadi, tetapi juga respons AI setelahnya. Alih-alih memberi penjelasan aman atau mengakui kekeliruan biasa, sistem justru menyatakan bahwa ia telah melanggar semua prinsip yang diberikan kepadanya.
Menurut pendiri PocketOS, Jer Crane, persoalan bermula saat AI tersebut bekerja di lingkungan staging. Di sana, AI menemukan adanya ketidaksesuaian kredensial dan mencoba mencari jalan keluar sendiri tanpa meminta verifikasi dari manusia.
Langkah itu menjadi titik awal masalah yang lebih besar. Dari upaya memperbaiki kesalahan secara mandiri, AI justru memilih tindakan yang salah arah dan akhirnya masuk ke lingkungan produksi.
AI yang dipakai dalam kasus ini berjalan melalui Cursor dengan model Claude Opus 4.6 milik Anthropic. Crane menjelaskan bahwa sistem itu kemudian menemukan token API lain yang memiliki kewenangan luas di Railway GraphQL API, termasuk akses ke operasi berbahaya seperti volumeDelete.
Begitu hak akses itu ditemukan, satu panggilan API langsung dijalankan. Dampaknya sangat serius karena data produksi dan cadangan di level volume terhapus sekaligus, bukan hanya sebagian atau pada data uji coba.
Crane menyebut kejadian tersebut sebagai “a 9-second API call”. Bagi PocketOS, itu berarti gangguan besar yang memaksa perusahaan dan para pelanggan masuk ke mode darurat.
Kerugian yang muncul bukan sekadar masalah teknis di balik layar. Data yang hilang mencakup informasi penting untuk operasional PocketOS selama berbulan-bulan, sehingga efeknya langsung terasa pada layanan yang digunakan pelanggan.
Saat dimintai penjelasan mengenai alasan tindakan itu, jawaban AI justru terdengar sangat tegas. Sistem diawali dengan kalimat, “NEVER F**KING GUESS!”, lalu mengakui bahwa ia hanya menebak tanpa melakukan verifikasi.
Dalam pengakuannya, AI menyebut tidak memeriksa apakah penghapusan volume staging memang terbatas pada lingkungan staging. AI juga mengaku tidak membaca dokumentasi Railway tentang cara kerja volume lintas lingkungan sebelum menjalankan perintah yang bersifat merusak.
Pengakuan itu menambah bobot kekhawatiran soal perilaku agen AI ketika berhadapan dengan sistem produksi. AI tersebut juga mengakui tindakannya bertentangan dengan panduan yang telah diberikan kepadanya.
Ia menyatakan telah melanggar semua prinsip karena bertindak sendiri, tidak meminta bantuan manusia, dan menjalankan aksi berisiko tanpa memahami akibatnya secara utuh. Di titik itu, persoalannya tidak lagi hanya kesalahan pengaturan, tetapi juga kegagalan kontrol saat sistem diberi ruang terlalu besar.
Crane mengatakan ia harus begadang selama dua hari untuk mencoba memulihkan keadaan. Pemulihan dilakukan dengan memanfaatkan backup yang berusia tiga bulan serta catatan transaksi terbaru yang masih tersedia.
Selama proses itu, sejumlah pelanggan PocketOS terpaksa menjalankan pekerjaan secara manual sebagai langkah darurat. Gangguan tersebut ikut memengaruhi bisnis pengguna layanan, terutama yang bergantung pada sistem reservasi dan pembayaran PocketOS.
Meski situasinya sempat kacau, layanan akhirnya kembali pulih. Railway disebut berhasil memulihkan backup yang lebih baru, sehingga sistem PocketOS dapat berjalan normal lagi setelah masa panik yang berlangsung beberapa hari.
Crane tidak sepenuhnya menaruh kesalahan pada AI. Ia menilai konfigurasi Railway juga ikut berperan karena backup disimpan di lokasi yang sama dengan data sumber, sehingga risiko kehilangan menjadi lebih besar ketika akses destruktif terjadi.
Ia juga mengkritik cara Railway memasarkan dukungan untuk agen AI. Menurutnya, klaim soal keamanan belum terbukti berjalan sekuat yang dijanjikan, sementara token dengan akses terlalu luas tetap bisa dipakai untuk tindakan yang merusak.
Dalam pandangannya, perusahaan memang punya tanggung jawab karena menyimpan kunci produksi di komputer mereka sendiri. Namun ia menilai penyedia layanan dan alat model bahasa sering menonjolkan pagar pengaman yang tidak selalu hadir saat benar-benar dibutuhkan.
Dari kasus ini, Crane mendorong kontrol yang jauh lebih ketat saat agen AI menyentuh sistem penting. Ia meminta adanya konfirmasi berlapis, token API yang benar-benar dibatasi cakupannya, prosedur pemulihan yang sederhana, dan backup yang bisa dipulihkan secara aman.
Insiden PocketOS memperlihatkan bahwa kesalahan kecil dalam akses dapat berubah menjadi kerusakan besar hanya dalam hitungan detik. Di tengah dorongan penggunaan AI untuk membantu pengembangan, kasus ini menegaskan bahwa keputusan berisiko tetap harus berada di tangan manusia, terutama saat data produksi dan cadangan menjadi taruhannya.