Skalierung der KI-Videogenerierung: Wie Novita AI mit WaveSpeedAI duale Optimierung von Effizienz und Kosten erreicht

Skalierung der KI-Videogenerierung: Wie Novita AI mit WaveSpeedAI duale Optimierung von Effizienz und Kosten erreicht

Skalierung der KI-Videogenerierung: Wie Novita AI Duale Optimierung von Effizienz und Kosten mit WaveSpeedAI erreicht

Novita AI

WaveSpeedAI hat unsere Inferenzeffizienz erheblich verbessert und uns geholfen, die Videogenerierungskosten um bis zu 67% zu senken. Mit schnellerer und zuverlässigerer Videoverarbeitung können wir ein außergewöhnliches Benutzererlebnis im großen Maßstab bieten.”
— Junyu Huang, Novita AI COO

Kundenhintergrund

Novita AI ist ein Unternehmen, das sich auf KI-Inferenz-Infrastruktur konzentriert und sich dem Ziel widmet, Schöpfern, Entwicklern und Unternehmen zuverlässige und effiziente Videogeneierungs-Inferenzdienste bereitzustellen. Das Unternehmen unterstützt die Bereitstellung mehrerer mainstream Videogenerationsmodelle und deckt End-to-End-Fähigkeiten von Bild-zu-Video- und Text-zu-Video-Generierung ab. Es bedient globale kreative Benutzer und KI-Plattformen bei Auflösungen von 720P bis 1080P.

Novita AI

Herausforderungen vor WaveSpeedAI

Mit der zunehmenden Anzahl von Modellen und der Komplexität des Services stand Novita AI mehreren Herausforderungen in seiner Inferenzarchitektur und im Betrieb gegenüber:

  • Komplexe Ressourcenplanung aufgrund von Multi-Modell-Bereitstellung: Die Unterstützung mehrerer Modelle wie Wan 2.1, Kling V1.6 und Hunyuan Video, die jeweils unterschiedliche Speicher- und Rechnenanforderungen haben, führte zu erheblichen Unterschieden in der Inferenzeffizienz.

  • Hohe Kosten für HD-Inferenz mit untergenutzten GPUs: Besonders bei 720P- und 1080P-Videogenerierungsaufgaben verbrauchten einzelne Inferenzzyklen große Mengen an GPU-Speicher, was zu hohen Kosten pro Generierungseinheit führte.

  • Instabile Latenz unter hoher Parallelität: Einige große Modelle erlebten erhebliche Antwortverzögerungen während der Spitzenverkehrslastzeiten, was sich negativ auf das Benutzererlebnis und den Ruf der Plattform auswirkte.

Zusammenarbeit mit WaveSpeedAI

Um diese Herausforderungen zu bewältigen, richtete Novita AI eine tiefe Zusammenarbeit mit WaveSpeed AI ein, die sich auf die optimierte Bereitstellung der folgenden Kernmodelle konzentrierte:

  • Wan 2.1 Bild-zu-Video / Text-zu-Video

Wan 2.1 Bild-zu-Video / Text-zu-Video

MiniMax Video 01

  • Kling V1.6 Bild-zu-Video / Text-zu-Video

Kling V1.6 Bild-zu-Video / Text-zu-Video

Mit der Unterstützung von WaveSpeed AI konnte Novita jedes Modell einzeln optimieren und GPU-Ressourcen dynamisch über einen einheitlichen Pool planen, wodurch sowohl Leistung als auch Kosteneffizienz maximiert wurden.

Ergebnisse & Vorteile

✅ Optimierung der Inferenzleistung: Die Inferenzeffizienz verbesserte sich um bis zu 25%, mit durchschnittlicher Videogenerierungszeit, die um 30–40% reduziert wurde.

ModellAuflösungZeit vor OptimierungZeit nach Optimierung
Hunyuan Video Fast720P2 Minuten1 Minute 30 Sekunden
Wan 2.1 Text-zu-Video1280×7202 Minuten 24 Sekunden1 Minute 55 Sekunden
Wan 2.1 Bild-zu-Video1280×7203 Minuten 10 Sekunden2 Minuten 30 Sekunden
Kling V1.6 Bild-zu-Video1080P / 5s$0.98 / Video$0.92 / Video

✅ Optimierung der Kostenstruktur: Durchschnittliche Kosten pro Anruf um über 30% reduziert, mit bis zu 66% Einsparungen bei hochauflösenden Szenarien.

ModellAuflösungKosten vor OptimierungKosten nach OptimierungKostenreduktion
Hunyuan Video Fast720P$0.18 / Sek$0.06 / Sek-66.7%
Wan 2.1 Text-zu-Video1280×720$0.06 / Sek$0.04 / Sek-33.3%
Wan 2.1 Bild-zu-Video1280×720$0.08 / Sek$0.06 / Sek-25.0%
Kling V1.6 Bild-zu-Video1080P / 5s$0.49 / Video$0.46 / Video-6.1%

✅ Verbesserte Systemstabilität: Modellreaktionen sind unter hoher Parallelität stabiler, die Erfolgsquoten der Videogenerierung stiegen, und die Ausfallquoten sanken unter 0.05%, was das Benutzererlebnis erheblich verbessert.

Ausblick

In Zukunft wird Novita AI seine Zusammenarbeit mit WaveSpeed AI weiter vertiefen, um die Flexibilität und Stabilität der Multi-Modell-Bereitstellung weiter zu verbessern, effizientere Videoinferenz-Frameworks zu erkunden und seine Kostenstruktur kontinuierlich zu optimieren. Mit den technischen Stärken von WaveSpeedAI ist Novita AI zuversichtlich, schnellere, stabilere und kostengünstigere Videogenerierungsdienste an globale Kunden bereitzustellen – und die Grenzen von Technologie und Geschäftswert im Bereich der KI-Medienerstellung zu verschieben.

Jetzt ausprobieren!

🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6