Model Video 'Omni' Misterius dari Google: Apa yang Terungkap dari Kebocoran UI Gemini Menjelang I/O 2026
Google tampaknya sedang menguji model generasi video baru bernama Omni di dalam Gemini, yang terungkap melalui string UI yang ditemukan menjelang Google I/O 2026. Inilah yang kita ketahui, yang belum kita ketahui, dan mengapa hal ini bisa sangat berarti — termasuk bagi Veo di WaveSpeedAI.
Model Video ‘Omni’ Misterius dari Google: Apa yang Diungkap Bocoran UI Gemini Jelang I/O 2026
Sebuah string UI kecil adalah keseluruhan cerita sejauh ini, namun string tersebut memiliki penempatan yang sangat menarik. TestingCatalog melaporkan bahwa tangkapan layar terbaru dari tab pembuatan video Gemini memuat baris yang belum pernah terlihat sebelumnya: “Start with an idea or try a template. Powered by Omni.” Omni muncul tepat di sebelah “Toucan” — nama internal untuk alat video saat ini milik Gemini, yang sudah didukung oleh Veo 3.1.
Dua minggu sebelum Google I/O 2026 dibuka (19–20 Mei), rumor ini sulit untuk diabaikan. Berikut apa yang disarankan oleh kebocoran ini, apa yang masih ambigu, dan di mana ini masuk dalam perlombaan pembuatan video yang lebih besar di tahun 2026.
Apa yang sebenarnya terlihat
Satu-satunya bukti adalah teks placeholder UI dari pengalaman pembuatan video Gemini. Dua detail menjadikannya lebih dari sekadar kebisingan:
- String tersebut terlihat oleh pengguna, tidak hanya tertanam dalam source code atau feature flag. Teks UI yang menyebut nama merek biasanya mencapai tahap tersebut hanya ketika tim sedang mempersiapkan rilis publik.
- Penempatannya ada di sebelah “Toucan” — nama kode internal yang diketahui untuk jalur pembuatan video berbasis Veo-3.1 milik Google saat ini di Gemini. Kode baru ada di sebelah kode lama. Nama produk baru yang ditempatkan di sebelah yang sudah ada adalah pola staging standar sebelum pergantian.
Postingan Threads TestingCatalog merangkumnya: “Jika Google berencana merilis Gemini Omni untuk pembuatan video, kemungkinan besar kinerjanya akan melampaui Veo 3.1.”
Apa yang sebenarnya bisa dimaksud “Omni”
Tiga interpretasi, dalam urutan tingkat transformatifnya:
1. Pembungkus Veo baru
Penjelasan yang paling tidak mengganggu: Omni adalah nama produk baru untuk tab video Gemini, dengan Veo 3.x atau Veo 4 masih melakukan pekerjaan pembuatan yang sebenarnya. Konsolidasi merek di bawah satu nama asli Gemini (seperti cara Nano Banana duduk di Gemini 3 / 3.1 Flash Image untuk gambar diam) akan menjelaskan mengapa string yang menghadap publik muncul sama sekali.
2. Model video baru yang dilatih Gemini
Google mungkin telah melatih model video in-house di bawah payung Gemini untuk mendampingi atau menggantikan Veo. Pemisahan saat ini — Veo untuk video, Nano Banana / Gemini untuk gambar — cukup canggung sehingga tim model memiliki alasan untuk menyatukannya. Omni akan menjadi hasilnya, dengan arsitektur dan profil benchmark tersendiri yang berbeda dari Veo 3.1.
3. Model omni sejati — satu sistem untuk gambar + video + lainnya
Interpretasi paling ambisius, dan yang disarankan oleh nama tersebut: satu model omni Gemini yang menangani pembuatan gambar, pembuatan video, dan mungkin audio dalam sistem yang sama, seperti cara GPT-4o diposisikan untuk teks-gambar-audio. Jika benar, Gemini akan menjadi model omni kelas atas pertama dengan output video — sebuah pencapaian yang berarti.
String yang bocor tidak dapat membedakan antara ini semua. Namun opsi (3) adalah satu-satunya yang membenarkan nama publik baru seperti “Omni” daripada sekadar menaikkan nomor versi Veo.
Mengapa ini penting untuk perlombaan pembuatan video di 2026
Pembuatan video adalah kategori paling kompetitif dalam AI generatif saat ini. Kondisi papan peringkat saat ini, secara kasar:
- ByteDance Seedance 2.0 berada di puncak benchmark publik, dengan varian Fast dan Turbo yang membuat video AI sinematik layak secara finansial untuk produksi volume tinggi.
- Alibaba Wan 2.7 menghadirkan text-to-video, image-to-video, video-edit, dan reference-to-video dengan gerakan tersinkronisasi audio pada 1080p.
- Kuaishou Kling V3.0 (Std + Pro + O3) menjadi jangkar gelombang yang dipimpin Asia bersama Wan dan Seedance.
- OpenAI Sora 2 kini tersedia luas, dengan varian Pro untuk resolusi lebih tinggi.
- Google Veo 3.1 memegang posisi unggul untuk karya kamera sinematik dan sinkronisasi audio-visual, namun telah dibatasi dan dikunci per wilayah.
Rilis Gemini Omni yang benar-benar melampaui Veo 3.1 — tolok ukur yang ditetapkan TestingCatalog — akan menjadi model terpadu multi-modal kelas atas pertama dengan output video, dan pertama kalinya Google memilih untuk bersaing dengan lini produk satu nama daripada pemisahan Veo / Imagen / Nano Banana.
Kapan ekspektasi pengungkapannya
Google I/O 2026 berlangsung 19–20 Mei 2026. Pembaruan Gemini dan AI telah dikonfirmasi sebagai agenda. Pola bocoran UI pra-I/O yang memunculkan nama publik baru konsisten dengan pengungkapan di atas panggung keynote.
Meski begitu, perlakukan semua ini sebagai spekulatif sampai Google mengatakannya di atas panggung. String UI pernah dirilis tanpa peluncuran produk sebelumnya. Interpretasi paling dapat dipertahankan dari kebocoran ini adalah: Google memiliki produk video bernama Omni dalam tahap staging akhir di Gemini, dan jendela paling masuk akal untuk peluncuran adalah dua minggu ke depan.
Apa artinya ini bagi pengguna WaveSpeedAI
Veo 3.1 sudah tersedia di WaveSpeedAI, dan kami berharap untuk menambahkan model video Gemini baru apa pun ke platform segera setelah rilis publik — API key tunggal yang sama, pola endpoint LLM yang kompatibel dengan OpenAI yang sama, harga per detik yang sama.
Jika Omni menggantikan atau melengkapi Veo 3.1, Anda akan dapat melakukan A/B-test terhadap sisa jajaran video-gen yang sudah kami host:
- Seedance 2.0 — SOTA saat ini dalam benchmark
- Wan 2.7 — Model video sinematik Alibaba
- Kling V3.0 Pro — Opsi fidelitas tinggi Kuaishou
- Sora 2 — Penawaran OpenAI
- Veo 3.1 — Model video Google saat ini
Jika Google merilis Omni di I/O, diharapkan dapat membandingkannya di bawah API yang sama dalam beberapa hari setelah peluncuran.
Pertanyaan yang sering diajukan
Apa model video “Omni” dari Google?
Berdasarkan string UI yang terlihat di tab pembuatan video Gemini, Omni tampaknya merupakan model pembuatan video atau merek produk baru Google yang menggantikan atau melengkapi alur video Gemini berbasis Veo-3.1 saat ini. Belum ada pengumuman resmi.
Apakah Omni akan menggantikan Veo 3.1?
Belum jelas. Tiga interpretasi yang masuk akal: (1) Omni adalah nama publik baru untuk jalur berbasis Veo yang sama; (2) Omni adalah model video baru yang dilatih Gemini di samping Veo; (3) Omni adalah model omni Gemini terpadu yang menangani gambar dan video dalam satu sistem. Hanya Google yang dapat mengkonfirmasi mana yang benar.
Kapan Google akan mengungkap Omni?
Jendela yang paling mungkin adalah Google I/O 2026 pada 19–20 Mei, di mana Google telah mengkonfirmasi bahwa pembaruan Gemini dan AI ada dalam agenda.
Apakah Omni akan melampaui Seedance 2.0?
ByteDance Seedance 2.0 saat ini memimpin sebagian besar benchmark video-gen publik. Apakah Omni dapat melampauinya sepenuhnya bergantung pada apa yang sebenarnya ada di baliknya — yang belum diketahui sama sekali.
Apakah Omni akan tersedia di WaveSpeedAI?
Jika Google merilis Omni secara publik, model tersebut akan ditambahkan ke katalog model WaveSpeedAI segera setelahnya, berdampingan dengan model video Veo 3.1, Seedance 2.0, Wan 2.7, Kling V3.0, dan Sora 2 yang sudah ada.
Pantau terus
Dua minggu hingga I/O. Kami akan memperbarui postingan ini pada hari Google mengkonfirmasi apapun; sementara itu, Veo 3.1 yang sudah ada beserta jajaran video-gen lainnya sudah aktif di WaveSpeedAI di bawah satu API.
Sumber: TestingCatalog (postingan web, Threads).




