Bagi AI yang harus memahami ruang fisik secara presisi, citra satelit komersial masih menyisakan masalah besar. Gambar yang tampak tajam untuk mata manusia belum tentu cukup rinci untuk model yang perlu membedakan objek di level centimeter.
Kesenjangan itu muncul karena kebutuhan visual AI jauh lebih ketat daripada kebutuhan pemantauan biasa. Pada skala tertentu, retakan trotoar dan noda abu-abu bisa terlihat hampir sama, padahal perbedaan kecil itu penting bagi sistem yang dipakai untuk robot, kendaraan otonom, dan augmented reality.
Ukuran yang paling menentukan di sini adalah ground sample distance, yaitu jarak fisik yang diwakili setiap piksel. Spexi menyebut citra drone miliknya mencapai 2,8 sentimeter per piksel, sementara satelit komersial terbaik masih berada di sekitar 30 sentimeter per piksel.
Selisih itu terdengar kecil, tetapi dampaknya besar saat dipakai melatih model AI. Objek yang pada citra 30 sentimeter hanya tampak sebagai satu piksel bisa berubah menjadi area yang jauh lebih kompleks ketika dilihat pada citra 3 sentimeter, dan model tidak selalu siap menghadapi perubahan itu.
Batas yang belum mudah ditembus
Keterbatasan citra satelit komersial bukan hanya soal optik. Regulasi juga ikut membentuk batas kemampuan sensor yang boleh beredar di pasar.
NOAA, lembaga di Amerika Serikat yang mengawasi remote sensing komersial, lama membatasi resolusi citra satelit komersial. Batas federal kemudian dilonggarkan dari 50 sentimeter menjadi 25 sentimeter pada 2014, tetapi jejak aturan itu masih terasa pada satelit yang beroperasi sekarang.
WorldView-3 milik Maxar menangkap citra pankromatik 31 sentimeter. SkySat milik Planet Labs mencapai hingga 50 sentimeter per piksel, sedangkan PlanetScope yang memantau permukaan daratan bumi setiap hari bekerja di sekitar 3 meter per piksel.
Ada pula upaya untuk mendorong kemampuan ini lebih jauh. Albedo Space meluncurkan Clarity-1 pada Maret 2025 dan menargetkan 10 sentimeter pankromatik serta 40 sentimeter multispektral dari Very Low Earth Orbit, meski posisinya masih sebagai penjelajah teknis, bukan sistem produksi skala besar.
Saat gambar tajam belum otomatis berguna
Masalahnya, peningkatan ketajaman tidak selalu membuat data lebih siap dipakai AI. Model yang belajar dari sensor, ketinggian, cahaya, dan distorsi geometri yang berbeda akan menyerap variasi itu sebagai bagian dari dunia nyata.
Kondisi tersebut dikenal sebagai domain shift, yaitu saat sifat statistik data latih berbeda dari data saat inferensi. Penelitian yang dikutip Kili Technology menyebut sensitivitas terhadap ground sample distance sebagai salah satu hambatan teknis terbesar dalam geospatial AI.
Persoalannya menjadi lebih rumit ketika model dilatih dari citra 30 sentimeter lalu dipakai pada citra 3 sentimeter. Ukuran objek, tekstur, dan pola visual berubah terlalu jauh sehingga model tidak punya kerangka yang stabil untuk menafsirkan detail baru itu.
Karena itu, para pengembang AI geospasial tidak lagi cukup mengejar jumlah data. Yang dibutuhkan adalah data yang seragam, distandardisasi, reliabel, dan konsisten dalam format maupun struktur.
Tinjauan GeoAI di arXiv menegaskan bahwa citra dari penyedia berbeda, waktu berbeda, sensor berbeda, atau kondisi pengambilan yang berbeda membuat standardisasi itu sulit dicapai. Masalah serupa juga muncul pada survei udara tradisional karena data sering datang dari kontraktor yang berbeda dengan peralatan dan kondisi yang tidak seragam.
Mengapa detail centimeter penting
Kebutuhan terhadap detail ini datang dari aplikasi yang sangat spesifik. Niantic menyebut model geospasial besar akan membantu komputer memahami ruang fisik dan berinteraksi dengannya, termasuk untuk kacamata AR, robotika, pembuatan konten, dan sistem otonom.
Niantic Spatial, yang dipisahkan dari pembuat Pokémon Go pada Mei 2025, membangun Visual Positioning System di atas lebih dari 50 juta jaringan saraf dengan lebih dari 150 triliun parameter. Sistem itu juga memakai basis data proprietary berisi lebih dari 30 miliar gambar berpose dan membutuhkan akurasi posisi hingga level sentimeter.
Kebutuhan itu terlihat jelas di lapangan. Robot pengantar di trotoar harus bisa membedakan trotoar, planter, dan bangku, sementara aplikasi AR harus menempatkan objek digital sejajar dengan adegan jalan nyata.
Dengan citra satelit beresolusi 30 sentimeter, tiga objek itu bisa tampak seperti gumpalan yang sama. Satelit tetap unggul untuk cakupan luas, pemantauan deforestasi, kesehatan tanaman, dan urban sprawl, tetapi untuk melatih AI yang bekerja di ruang fisik nyata, detail yang seragam dan sangat tajam masih belum tergantikan.





