Google mengarahkan Gemini Omni ke wilayah yang lebih berani dalam video AI. Alih-alih sekadar membuat adegan dari teks, model ini justru dirancang untuk mengolah rekaman nyata menjadi klip yang jauh lebih surealis dan eksperimental.
Perubahan arah itu penting karena membawa video AI Google ke tahap yang berbeda. Jika Veo dikenal kuat dalam menjaga konsistensi elemen dan sinkronisasi bibir yang rapi, Gemini Omni justru membuka ruang untuk memelintir footage dunia nyata menjadi hasil yang lebih liar.
Dari footage asli ke hasil yang lebih ekstrem
Gemini Omni pertama kali diperkenalkan dalam bentuk Omni Flash. Google menyebut model ini mampu memadukan teks, audio, gambar statis, dan video untuk menghasilkan keluaran yang sangat berbeda dalam salah satu format tersebut.
Pada tahap awal, video tetap menjadi fokus utama. Google memposisikan Omni sebagai alat untuk membuat video yang imajinatif, tetapi tetap mempertahankan konsistensi karakter di banyak frame.
Pendekatan seperti ini membuat Gemini Omni terasa sebagai kelas model multimodal yang baru. Model ini tidak hanya menghasilkan visual, tetapi juga memproses beberapa aspek sekaligus untuk mengikuti alur cerita yang sedang dibangun.
Kreasi tidak berhenti di satu prompt
Gemini Omni juga memberi ruang penyempurnaan berulang lewat instruksi bahasa alami. Artinya, proses kreatif tidak berhenti setelah satu perintah awal diberikan, karena hasil video masih bisa diarahkan lagi sampai mendekati visi yang diinginkan.
Google menekankan bahwa model ini dibangun untuk memahami konteks secara lebih luas. Karena itu, pengguna dapat terus mengubah arah hasil tanpa harus memulai dari nol setiap kali.
Di titik ini, Omni tampil lebih sebagai alat eksplorasi ketimbang generator sekali jadi. Output yang dihasilkan bisa berkembang bertahap seiring arahan yang diberikan pengguna.
Fondasi Veo, tetapi cakupannya meluas
Kehadiran Gemini Omni tidak lepas dari dasar yang sudah dibangun Veo di ekosistem Google. Veo Gen 3 dikenal mampu menyusun adegan utuh dengan elemen yang konsisten dan sinkronisasi bibir yang sangat rapi.
Namun, Veo 3 dan versi lebih baru 3.1 disebut masih terbatas pada video yang sepenuhnya dihasilkan AI dari teks dan audio. Gemini Omni melangkah lebih jauh dengan membuka peluang mengubah video kehidupan nyata menjadi materi baru yang lebih eksperimental.
Google juga mengklaim model ini memahami dunia fisik dengan lebih baik. Menurut perusahaan, video yang dihasilkan akan mengikuti fisika dunia nyata berkat pemahaman terhadap gravitasi, energi kinetik, dan dinamika fluida.
Input beragam, hasil lebih personal
Pengguna tidak harus memulai dari video. Referensi berupa gambar, audio, atau video bisa dipakai sebagai titik awal, sementara teks saja juga cukup untuk menjelaskan konsep yang ingin diwujudkan.
Google turut membuka kemungkinan penggunaan versi digital diri sendiri melalui fitur Avatars. Dengan fitur itu, pengguna dapat membuat video yang menampilkan karakter yang terlihat dan terdengar seperti dirinya.
Arah ini memperluas fungsi Gemini Omni ke wilayah yang lebih personal. Model ini tidak hanya berguna untuk efek visual, tetapi juga untuk pembuatan karakter, eksperimen identitas digital, dan produksi konten yang lebih individual.
Akses lewat Gemini, Flow, dan YouTube
Google menggulirkan Gemini Omni melalui model Flash di aplikasi Gemini. Akses ini tersedia untuk pelanggan berbayar di tingkat Google AI Plus, Pro, dan Ultra.
Omni juga akan hadir di Flow, alat pembuatan film berbasis AI milik Google. Kehadirannya di sana menunjukkan bahwa model ini disiapkan bukan hanya untuk eksperimen singkat, tetapi juga untuk alur kerja kreatif yang lebih serius.
Bagi pengguna yang ingin mencoba tanpa biaya, Google menyiapkan jalur akses melalui YouTube. Di platform itu, Omni bisa dipakai untuk membuat Remixes dari Shorts yang sudah ada, termasuk melalui YouTube Create.
Contoh penggunaan dan pertanyaan yang belum terjawab
Google sudah membagikan dua contoh untuk memperlihatkan kemampuan model ini. Salah satunya menampilkan komedian Adam Waheed, sementara contoh lain melibatkan YouTuber Happy Kelli.
Contoh tersebut menunjukkan bagaimana rekaman nyata bisa diolah menjadi klip yang lebih dramatis dan tidak biasa. Fokusnya ada pada sejauh mana subjek utama masih bisa dipertahankan saat materi aslinya berubah jauh.
Meski begitu, satu isu penting masih menggantung. Google belum mengonfirmasi apakah kreator nantinya bisa membatasi atau melarang konten mereka di-remix menggunakan AI.
Pertanyaan itu bisa menjadi sorotan besar saat fitur Remix untuk Shorts meluas. Semakin mudah video asli diubah menjadi karya baru, semakin penting pula kontrol kreator atas kontennya sendiri.
Source: www.androidauthority.com