#model-release

317 articles - Page 20

Vidu Image-to-Video Q2 Turbo auf WaveSpeedAI

Vidu Q2 Turbo Image-to-Video wandelt ein einzelnes Bild in sanfte, kinematische Bewegung mit schnellem, hochwertigem Output um. Ready-to-use REST Inference API, beste Leistung, keine Coldstarts, erschwingliche Preisgestaltung.

2025-08-186 Min. Lesezeit

Vidu Reference To Video Q2 auf WaveSpeedAI vorgestellt

Vidu Q2 ist ein Image-to-Video- und Reference-to-Video-Modell, das subtile Gesichtsausdrücke und sanfte Kamera-Zoom-Bewegungen für natürliche Bewegungen betont. REST-Inferenz-API einsatzbereit, beste Leistung, keine Kaltstarts, erschwingliche Preise.

2025-08-175 Min. Lesezeit

Einführung von Vidu Template Halloween auf WaveSpeedAI

Vidu Halloween Templates bietet vorgefertigte Bild- und Videovorlagen für gruselige Promos und Event-Einladungen mit Overlays. Einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstart-Verzögerungen, erschwingliche Preise.

2025-08-175 Min. Lesezeit

ByteDance LipSync Audio-zu-Video jetzt auf WaveSpeedAI verfügbar

ByteDance LipSync wandelt Audio in lebensechte sprechende Videos um, indem es präzise Lippenbewegungen generiert, die perfekt mit der Eingabe-Audio synchronisiert sind. Ready-to-use REST Inference API, beste Performance, keine Kaltstartszeiten, günstige Preise.

2025-08-135 Min. Lesezeit

ByteDance Video Upscaler auf WaveSpeedAI

ByteDance Video Upscaler nutzt KI-Super-Resolution, um Videos auf 4K hochzuskalieren und feine Details in einer sicheren Cloud-Umgebung wiederherzustellen. Einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preisgestaltung.

2025-08-125 Min. Lesezeit

ByteDance Uso auf WaveSpeedAI vorgestellt

USO (Unified Style-Subject Optimized) von ByteDance vereinheitlicht stilgesteuerte und subjektgesteuerte Generierung, um konsistente Ausgaben zu produzieren, die künstlerischen Stil mit Subjekttreue verbinden. REST-Inferenz-API einsatzbereit, beste Leistung, keine Kaltstartverzögerungen, erschwingliche Preisgestaltung.

2025-08-114 Min. Lesezeit

ElevenLabs Eleven V3 jetzt auf WaveSpeedAI verfügbar

ElevenLabs eleven-v3 ist ein Text-zu-Sprache-Modell, das als gehosteter Endpunkt verfügbar ist; Anfragen kosten $0,1 pro 1000 Zeichen. Produktionsbereite REST-Inferenz-API, beste Leistung, keine Kaltstart-Verzögerungen, erschwingliche Preisgestaltung.

2025-08-115 Min. Lesezeit

Einführung von ElevenLabs Flash V2.5 auf WaveSpeedAI

ElevenLabs Flash V2 ist ein Text-to-Speech-Modell, das Text mit der ElevenLabs Flash V2-Engine in gesprochenes Audio umwandelt. REST-Inferenz-API einsatzbereit, beste Leistung, keine Kaltstarts, erschwingliche Preise.

2025-08-116 Min. Lesezeit

ElevenLabs Flash V2 auf WaveSpeedAI

ElevenLabs Flash V2 ist ein Text-to-Speech-Modell, das Text in gesprochenes Audio mit der ElevenLabs Flash V2-Engine umwandelt. Sofort einsatzfähige REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preisgestaltung.

2025-08-116 Min. Lesezeit

ElevenLabs Eleven V3 Timing auf WaveSpeedAI vorgestellt

ElevenLabs Eleven-V3 Timing konvertiert Text in natürliche Sprache und gibt Alignment-Metadaten zurück – Zeichen-/Wort-Zeitstempel in JSON – für präzise Untertitel, Karaoke-Effekte und Lippensynchronisation. Unterstützt voice_id, Ähnlichkeit/Stabilität und optionales Speaker Boost. Preis: 0,10 $ pro 1.000 Zeichen. Sofort einsatzbereit

2025-08-105 Min. Lesezeit

ElevenLabs Multilingual V1 auf WaveSpeedAI eingeführt

ElevenLabs Multilingual V1 bietet natürlich klingende mehrsprachige Text-zu-Sprache in vielen Sprachen. Ready-to-use REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.

2025-08-105 Min. Lesezeit

Einführung von ElevenLabs Multilingual V2 auf WaveSpeedAI

ElevenLabs Multilingual V2 ist ein mehrsprachiges Text-to-Speech-Modell; Kosten 0,1 $ pro 1000 Zeichen. Einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.

2025-08-106 Min. Lesezeit