#model-release
392 articles - Page 10
Memperkenalkan Kuaishou Kling Image O1 di WaveSpeedAI
Kling Omni Image O1 adalah model generasi gambar multi-modal Kuaishou dengan teknologi MVL. Mendukung hingga 10 gambar referensi untuk konsistensi fitur, pengeditan detail yang presisi (tambah/hapus/ubah), kontrol gaya, dan pembuatan konten seri. Sempurna untuk desain karakter IP, panel komik, dan merchandise merek
Memperkenalkan Google Nano Banana Pro Edit Multi di WaveSpeedAI
Google's Nano Banana Pro (Gemini 3.0 Pro Image) Edit adalah model penyuntingan gambar generasi berikutnya yang mampu menghasilkan beberapa gambar tersemat berkualitas tinggi dalam satu kali proses. Biaya sangat rendah — hanya $0,07 per gambar. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan MiniMax Hailuo 2.3 T2V Pro di WaveSpeedAI
MiniMax Hailuo 2.3 Pro adalah model text-to-video yang menghasilkan video 1080p dengan efisiensi 2.5x dan akurasi instruksi kompleks 85%. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan MiniMax Hailuo 2.3 T2V Standard di WaveSpeedAI
Hailuo 2.3 adalah model text-to-video yang menciptakan video 768p yang menyadari fisika dengan efisiensi 2,5× dan tingkat respons instruksi kompleks 85%. REST inference API siap pakai, performa terbaik, tanpa coldstarts, harga terjangkau.
Memperkenalkan Google Gemini 3 Pro Image Edit di WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Image) Edit memungkinkan pengeditan gambar dan generasi teks-ke-gambar dengan output yang mampu 4K untuk perangkat mobile. REST inference API siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan FLUX 2 Dev Text-to-Image WaveSpeedAI di WaveSpeedAI
FLUX.2 [dev] dari Black Forest Labs memberikan generasi teks-ke-gambar berkualitas studio yang cepat dengan realisme yang ditingkatkan, rendering teks yang lebih tajam, dan pengeditan bawaan untuk iterasi cepat. REST inference API siap pakai, performa terbaik, tanpa cold starts, harga terjangkau.
Memperkenalkan Google Gemini 3 Pro Image Text-to-Image di WaveSpeedAI
Google's Gemini 3.0 Pro (Gemini 3.0 Pro Preview) adalah model text-to-image terdepan yang memungkinkan generasi gambar resolusi tinggi 4K yang dioptimalkan untuk ponsel. REST inference API siap pakai, performa terbaik, tanpa coldstarts, harga terjangkau.
Memperkenalkan WaveSpeedAI InfiniteTalk Fast Multi di WaveSpeedAI
InfiniteTalk fast multi mengkonversi satu gambar dan dua input audio menjadi video multi-karakter berbicara atau bernyanyi. REST inference API siap pakai, performa terbaik, tanpa cold starts, harga terjangkau.
Memperkenalkan WaveSpeedAI HunyuanVideo Foley di WaveSpeedAI
HunyuanVideo-Foley menghasilkan audio Foley dan ambient yang realistis dari video yang diunggah menggunakan prompt teks untuk mendeskripsikan suara yang diinginkan. REST inference API yang siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan WaveSpeedAI Think Sound di WaveSpeedAI
ThinkSound mengubah video yang diunggah menjadi audio yang realistis dan dipandu oleh teks. Unggah video dan tambahkan prompt teks untuk menghasilkan suara yang hidup. REST inference API siap pakai, performa terbaik, tanpa coldstarts, harga terjangkau.
Memperkenalkan WaveSpeedAI WAN 2.2 Video Edit di WaveSpeedAI
Wan 2.2 Video Edit memungkinkan Anda memodifikasi video melalui perintah teks (misalnya, mengubah pakaian atau karakter). Didukung oleh Wan 2.2, mendukung 480p ($0,20/5d) dan 720p ($0,40/5d), hingga 120 detik. API inferensi REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.
Memperkenalkan MiniMax Speech 02 HD di WaveSpeedAI
MiniMax Speech 02 HD adalah model text-to-speech definisi tinggi dari MiniMax yang menghadirkan suara HD yang jernih; harga $0,05 per 1.000 karakter. API inference REST siap pakai, performa terbaik, tanpa coldstart, harga terjangkau.