Skalierung der KI-Videogenerierung: Wie Novita AI mit WaveSpeedAI duale Optimierung von Effizienz und Kosten erreicht
Skalierung der KI-Videogenerierung: Wie Novita AI Duale Optimierung von Effizienz und Kosten mit WaveSpeedAI erreicht

WaveSpeedAI hat unsere Inferenzeffizienz erheblich verbessert und uns geholfen, die Videogenerierungskosten um bis zu 67% zu senken. Mit schnellerer und zuverlässigerer Videoverarbeitung können wir ein außergewöhnliches Benutzererlebnis im großen Maßstab bieten.”
— Junyu Huang, Novita AI COO
Kundenhintergrund
Novita AI ist ein Unternehmen, das sich auf KI-Inferenz-Infrastruktur konzentriert und sich dem Ziel widmet, Schöpfern, Entwicklern und Unternehmen zuverlässige und effiziente Videogeneierungs-Inferenzdienste bereitzustellen. Das Unternehmen unterstützt die Bereitstellung mehrerer mainstream Videogenerationsmodelle und deckt End-to-End-Fähigkeiten von Bild-zu-Video- und Text-zu-Video-Generierung ab. Es bedient globale kreative Benutzer und KI-Plattformen bei Auflösungen von 720P bis 1080P.

Herausforderungen vor WaveSpeedAI
Mit der zunehmenden Anzahl von Modellen und der Komplexität des Services stand Novita AI mehreren Herausforderungen in seiner Inferenzarchitektur und im Betrieb gegenüber:
-
Komplexe Ressourcenplanung aufgrund von Multi-Modell-Bereitstellung: Die Unterstützung mehrerer Modelle wie Wan 2.1, Kling V1.6 und Hunyuan Video, die jeweils unterschiedliche Speicher- und Rechnenanforderungen haben, führte zu erheblichen Unterschieden in der Inferenzeffizienz.
-
Hohe Kosten für HD-Inferenz mit untergenutzten GPUs: Besonders bei 720P- und 1080P-Videogenerierungsaufgaben verbrauchten einzelne Inferenzzyklen große Mengen an GPU-Speicher, was zu hohen Kosten pro Generierungseinheit führte.
-
Instabile Latenz unter hoher Parallelität: Einige große Modelle erlebten erhebliche Antwortverzögerungen während der Spitzenverkehrslastzeiten, was sich negativ auf das Benutzererlebnis und den Ruf der Plattform auswirkte.
Zusammenarbeit mit WaveSpeedAI
Um diese Herausforderungen zu bewältigen, richtete Novita AI eine tiefe Zusammenarbeit mit WaveSpeed AI ein, die sich auf die optimierte Bereitstellung der folgenden Kernmodelle konzentrierte:
- Wan 2.1 Bild-zu-Video / Text-zu-Video

- Hunyuan Video Fast

- Kling V1.6 Bild-zu-Video / Text-zu-Video

Mit der Unterstützung von WaveSpeed AI konnte Novita jedes Modell einzeln optimieren und GPU-Ressourcen dynamisch über einen einheitlichen Pool planen, wodurch sowohl Leistung als auch Kosteneffizienz maximiert wurden.
Ergebnisse & Vorteile
✅ Optimierung der Inferenzleistung: Die Inferenzeffizienz verbesserte sich um bis zu 25%, mit durchschnittlicher Videogenerierungszeit, die um 30–40% reduziert wurde.
| Modell | Auflösung | Zeit vor Optimierung | Zeit nach Optimierung |
|---|---|---|---|
| Hunyuan Video Fast | 720P | 2 Minuten | 1 Minute 30 Sekunden |
| Wan 2.1 Text-zu-Video | 1280×720 | 2 Minuten 24 Sekunden | 1 Minute 55 Sekunden |
| Wan 2.1 Bild-zu-Video | 1280×720 | 3 Minuten 10 Sekunden | 2 Minuten 30 Sekunden |
| Kling V1.6 Bild-zu-Video | 1080P / 5s | $0.98 / Video | $0.92 / Video |
✅ Optimierung der Kostenstruktur: Durchschnittliche Kosten pro Anruf um über 30% reduziert, mit bis zu 66% Einsparungen bei hochauflösenden Szenarien.
| Modell | Auflösung | Kosten vor Optimierung | Kosten nach Optimierung | Kostenreduktion |
|---|---|---|---|---|
| Hunyuan Video Fast | 720P | $0.18 / Sek | $0.06 / Sek | -66.7% |
| Wan 2.1 Text-zu-Video | 1280×720 | $0.06 / Sek | $0.04 / Sek | -33.3% |
| Wan 2.1 Bild-zu-Video | 1280×720 | $0.08 / Sek | $0.06 / Sek | -25.0% |
| Kling V1.6 Bild-zu-Video | 1080P / 5s | $0.49 / Video | $0.46 / Video | -6.1% |
✅ Verbesserte Systemstabilität: Modellreaktionen sind unter hoher Parallelität stabiler, die Erfolgsquoten der Videogenerierung stiegen, und die Ausfallquoten sanken unter 0.05%, was das Benutzererlebnis erheblich verbessert.
Ausblick
In Zukunft wird Novita AI seine Zusammenarbeit mit WaveSpeed AI weiter vertiefen, um die Flexibilität und Stabilität der Multi-Modell-Bereitstellung weiter zu verbessern, effizientere Videoinferenz-Frameworks zu erkunden und seine Kostenstruktur kontinuierlich zu optimieren. Mit den technischen Stärken von WaveSpeedAI ist Novita AI zuversichtlich, schnellere, stabilere und kostengünstigere Videogenerierungsdienste an globale Kunden bereitzustellen – und die Grenzen von Technologie und Geschäftswert im Bereich der KI-Medienerstellung zu verschieben.
Jetzt ausprobieren!
🔗Wan-2.1-14b-vace
🔗Hunyuan Video
🔗MiniMax Video 01
🔗Kling V1.6





