Skalierung der KI-Videogenerierung: Wie Novita AI Duale Optimierung von Effizienz und Kosten mit WaveSpeedAI erreicht

Novita AI

WaveSpeedAI hat unsere Inferenzeffizienz erheblich verbessert und uns geholfen, die Videogenerierungskosten um bis zu 67% zu senken. Mit schnellerer und zuverlässigerer Videoverarbeitung können wir ein außergewöhnliches Benutzererlebnis im großen Maßstab bieten.”
— Junyu Huang, Novita AI COO

Kundenhintergrund

Novita AI ist ein Unternehmen, das sich auf KI-Inferenz-Infrastruktur konzentriert und sich dem Ziel widmet, Schöpfern, Entwicklern und Unternehmen zuverlässige und effiziente Videogeneierungs-Inferenzdienste bereitzustellen. Das Unternehmen unterstützt die Bereitstellung mehrerer mainstream Videogenerationsmodelle und deckt End-to-End-Fähigkeiten von Bild-zu-Video- und Text-zu-Video-Generierung ab. Es bedient globale kreative Benutzer und KI-Plattformen bei Auflösungen von 720P bis 1080P.

Novita AI

Herausforderungen vor WaveSpeedAI

Mit der zunehmenden Anzahl von Modellen und der Komplexität des Services stand Novita AI mehreren Herausforderungen in seiner Inferenzarchitektur und im Betrieb gegenüber:

Komplexe Ressourcenplanung aufgrund von Multi-Modell-Bereitstellung: Die Unterstützung mehrerer Modelle wie Wan 2.1, Kling V1.6 und Hunyuan Video, die jeweils unterschiedliche Speicher- und Rechnenanforderungen haben, führte zu erheblichen Unterschieden in der Inferenzeffizienz.
Hohe Kosten für HD-Inferenz mit untergenutzten GPUs: Besonders bei 720P- und 1080P-Videogenerierungsaufgaben verbrauchten einzelne Inferenzzyklen große Mengen an GPU-Speicher, was zu hohen Kosten pro Generierungseinheit führte.
Instabile Latenz unter hoher Parallelität: Einige große Modelle erlebten erhebliche Antwortverzögerungen während der Spitzenverkehrslastzeiten, was sich negativ auf das Benutzererlebnis und den Ruf der Plattform auswirkte.

Zusammenarbeit mit WaveSpeedAI

Um diese Herausforderungen zu bewältigen, richtete Novita AI eine tiefe Zusammenarbeit mit WaveSpeed AI ein, die sich auf die optimierte Bereitstellung der folgenden Kernmodelle konzentrierte:

Wan 2.1 Bild-zu-Video / Text-zu-Video

Wan 2.1 Bild-zu-Video / Text-zu-Video

Hunyuan Video Fast

MiniMax Video 01

MiniMax Video 01

Kling V1.6 Bild-zu-Video / Text-zu-Video

Kling V1.6 Bild-zu-Video / Text-zu-Video

Mit der Unterstützung von WaveSpeed AI konnte Novita jedes Modell einzeln optimieren und GPU-Ressourcen dynamisch über einen einheitlichen Pool planen, wodurch sowohl Leistung als auch Kosteneffizienz maximiert wurden.

Ergebnisse & Vorteile

✅ Optimierung der Inferenzleistung: Die Inferenzeffizienz verbesserte sich um bis zu 25%, mit durchschnittlicher Videogenerierungszeit, die um 30–40% reduziert wurde.

Modell	Auflösung	Zeit vor Optimierung	Zeit nach Optimierung
Hunyuan Video Fast	720P	2 Minuten	1 Minute 30 Sekunden
Wan 2.1 Text-zu-Video	1280×720	2 Minuten 24 Sekunden	1 Minute 55 Sekunden
Wan 2.1 Bild-zu-Video	1280×720	3 Minuten 10 Sekunden	2 Minuten 30 Sekunden
Kling V1.6 Bild-zu-Video	1080P / 5s	$0.98 / Video	$0.92 / Video

✅ Optimierung der Kostenstruktur: Durchschnittliche Kosten pro Anruf um über 30% reduziert, mit bis zu 66% Einsparungen bei hochauflösenden Szenarien.

Modell	Auflösung	Kosten vor Optimierung	Kosten nach Optimierung	Kostenreduktion
Hunyuan Video Fast	720P	$0.18 / Sek	$0.06 / Sek	-66.7%
Wan 2.1 Text-zu-Video	1280×720	$0.06 / Sek	$0.04 / Sek	-33.3%
Wan 2.1 Bild-zu-Video	1280×720	$0.08 / Sek	$0.06 / Sek	-25.0%
Kling V1.6 Bild-zu-Video	1080P / 5s	$0.49 / Video	$0.46 / Video	-6.1%

✅ Verbesserte Systemstabilität: Modellreaktionen sind unter hoher Parallelität stabiler, die Erfolgsquoten der Videogenerierung stiegen, und die Ausfallquoten sanken unter 0.05%, was das Benutzererlebnis erheblich verbessert.

Ausblick

In Zukunft wird Novita AI seine Zusammenarbeit mit WaveSpeed AI weiter vertiefen, um die Flexibilität und Stabilität der Multi-Modell-Bereitstellung weiter zu verbessern, effizientere Videoinferenz-Frameworks zu erkunden und seine Kostenstruktur kontinuierlich zu optimieren. Mit den technischen Stärken von WaveSpeedAI ist Novita AI zuversichtlich, schnellere, stabilere und kostengünstigere Videogenerierungsdienste an globale Kunden bereitzustellen – und die Grenzen von Technologie und Geschäftswert im Bereich der KI-Medienerstellung zu verschieben.

Jetzt ausprobieren!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6

Skalierung der KI-Videogenerierung: Wie Novita AI Duale Optimierung von Effizienz und Kosten mit WaveSpeedAI erreicht

Kundenhintergrund

Herausforderungen vor WaveSpeedAI

Zusammenarbeit mit WaveSpeedAI

Ergebnisse & Vorteile

Ausblick

Jetzt ausprobieren!

Verwandte Artikel

Seedance 2.0 kommt bald: ByteDances nächste Generation Video-Modell mit nativer Audioerzeugung

Seedance 2.0 Vollständiger Leitfaden: Multimodale Videoerstellung

Seedance 2.0 vs Kling 3.0 vs Sora 2 vs Veo 3.1: Der ultimative Vergleich der Videogenerierung

Vidu Q3 Review: Vergleich mit Sora 2, Wan 2.6, Seedance 1.5, Veo 3.1 und Grok Imagine Video

Grok Imagine Video vs Sora 2, Veo 3.1, Seedance 1.5, WAN 2.5/2.6 und Vidu Q3: Vollständiger Vergleich

Was man von Kling 3.0 erwarten kann: Eine technische Vorschau