#model-release
346 articles - Page 20
Einführung ByteDance Dreamina V3.0 Edit auf WaveSpeedAI
ByteDance Dreamina 3.0 Edit ist ein Image-to-Image-Modell, das Ästhetik, Stil und Details verbessert und Textaufforderungen akzeptiert. REST-Inferenz-API einsatzbereit, beste Leistung, keine Kaltstart-Zeiten, erschwingliche Preise.
ByteDance Dreamina V3.0 Text-zu-Bild auf WaveSpeedAI
ByteDance Dreamina V3.0 ist ein Text-zu-Bild-Modell mit verbessertem visuellen Effekten, reichhaltigerem Detail und erhöhter Stilgenauigkeit zur Erzeugung ästhetischerer und authentischerer Bilder aus Textaufforderungen. Einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstartsperrungen, erschwingliche Preise.
ByteDance Dreamina V3.1 Text-to-Image jetzt auf WaveSpeedAI
ByteDance Dreamina V3.1 ist ein Text-zu-Bild-Modell mit verbesserter Ästhetik und Stilgenauigkeit, das reichhaltigere und polierter aussehende Bilder produziert. Sofort einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstartszeiten, erschwingliche Preise.
ByteDance LipSync Audio-zu-Video jetzt auf WaveSpeedAI verfügbar
ByteDance LipSync wandelt Audio in lebensechte sprechende Videos um, indem es präzise Lippenbewegungen generiert, die perfekt mit der Eingabe-Audio synchronisiert sind. Ready-to-use REST Inference API, beste Performance, keine Kaltstartszeiten, günstige Preise.
ByteDance Video Upscaler auf WaveSpeedAI
ByteDance Video Upscaler nutzt KI-Super-Resolution, um Videos auf 4K hochzuskalieren und feine Details in einer sicheren Cloud-Umgebung wiederherzustellen. Einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preisgestaltung.
ByteDance Uso auf WaveSpeedAI vorgestellt
USO (Unified Style-Subject Optimized) von ByteDance vereinheitlicht stilgesteuerte und subjektgesteuerte Generierung, um konsistente Ausgaben zu produzieren, die künstlerischen Stil mit Subjekttreue verbinden. REST-Inferenz-API einsatzbereit, beste Leistung, keine Kaltstartverzögerungen, erschwingliche Preisgestaltung.
ElevenLabs Eleven V3 jetzt auf WaveSpeedAI verfügbar
ElevenLabs eleven-v3 ist ein Text-zu-Sprache-Modell, das als gehosteter Endpunkt verfügbar ist; Anfragen kosten $0,1 pro 1000 Zeichen. Produktionsbereite REST-Inferenz-API, beste Leistung, keine Kaltstart-Verzögerungen, erschwingliche Preisgestaltung.
ElevenLabs Flash V2 auf WaveSpeedAI
ElevenLabs Flash V2 ist ein Text-to-Speech-Modell, das Text in gesprochenes Audio mit der ElevenLabs Flash V2-Engine umwandelt. Sofort einsatzfähige REST-Inferenz-API, beste Leistung, keine Kaltstarts, erschwingliche Preisgestaltung.
Einführung von ElevenLabs Flash V2.5 auf WaveSpeedAI
ElevenLabs Flash V2 ist ein Text-to-Speech-Modell, das Text mit der ElevenLabs Flash V2-Engine in gesprochenes Audio umwandelt. REST-Inferenz-API einsatzbereit, beste Leistung, keine Kaltstarts, erschwingliche Preise.
ElevenLabs Eleven V3 Timing auf WaveSpeedAI vorgestellt
ElevenLabs Eleven-V3 Timing konvertiert Text in natürliche Sprache und gibt Alignment-Metadaten zurück – Zeichen-/Wort-Zeitstempel in JSON – für präzise Untertitel, Karaoke-Effekte und Lippensynchronisation. Unterstützt voice_id, Ähnlichkeit/Stabilität und optionales Speaker Boost. Preis: 0,10 $ pro 1.000 Zeichen. Sofort einsatzbereit
ElevenLabs Multilingual V1 auf WaveSpeedAI eingeführt
ElevenLabs Multilingual V1 bietet natürlich klingende mehrsprachige Text-zu-Sprache in vielen Sprachen. Ready-to-use REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.
Einführung von ElevenLabs Multilingual V2 auf WaveSpeedAI
ElevenLabs Multilingual V2 ist ein mehrsprachiges Text-to-Speech-Modell; Kosten 0,1 $ pro 1000 Zeichen. Einsatzbereite REST-Inference-API, beste Leistung, keine Kaltstarts, erschwingliche Preise.