WaveSpeed Blog

Neueste Nachrichten zu KI-Bild- und Videogenerierungsmodellen — Engineering-Updates, Produkt-Launches, Tutorials und Deep Dives.

Gemini 3.5 Flash veröffentlicht — Ein Flash-Tier-Modell führt jetzt die Pro-Tier auf Agent-Benchmarks an
gemini-3-5-flashgoogle

Gemini 3.5 Flash veröffentlicht — Ein Flash-Tier-Modell führt jetzt die Pro-Tier auf Agent-Benchmarks an

Gemini 3.5 Flash wurde auf der I/O 2026 als GA veröffentlicht – mit standardmäßig aktiviertem Thinking-Modus, 1,50 $/9 $ pro 1 Million Token und einem Benchmark-Profil, das Claude Opus 4.7 und GPT-5.5 bei MCP Atlas und den meisten Agent-Suites übertrifft. Hier erfahren Sie, wo Flash führt, wo es verliert und wie Sie es einsetzen.

8 min read
Gemini 3.5 Pro kommt nächsten Monat — Was uns das Flash-Release bereits verrät
gemini-3-5gemini-3-5-pro

Gemini 3.5 Pro kommt nächsten Monat — Was uns das Flash-Release bereits verrät

Google hat Gemini 3.5 Flash auf dem I/O 2026 vorgestellt und Pro für Juni zurückgehalten. Flash übertrifft bereits Gemini 3.1 Pro bei Coding- und agentischen Benchmarks, zeigt jedoch Rückschritte bei komplexem Reasoning — genau die Lücke, die Pro schließen soll. Was bekannt ist, was nicht, und wie man plant.

6 min read
Gemini Omni Flash veröffentlicht: 10-Sekunden-Multimodal-Video, SynthID-Wasserzeichen, Audio-Bearbeitung zurückgehalten
gemini-omnigemini-omni-flash

Gemini Omni Flash veröffentlicht: 10-Sekunden-Multimodal-Video, SynthID-Wasserzeichen, Audio-Bearbeitung zurückgehalten

Google hat Gemini Omni Flash auf der I/O 2026 vorgestellt – ein einzelnes Modell, das Text, Bild, Audio und Video verarbeitet, um ein konsistentes Video-Ergebnis mit synchronem Audio zu erzeugen. Hier erfahren Sie, was veröffentlicht wurde, was nicht, und wie es sich von Veo unterscheidet.

7 min read
Arcanine Leak: Was Entwickler nicht annehmen sollten

Arcanine Leak: Was Entwickler nicht annehmen sollten

Arcanine ist in KI-Leak-Diskussionen aufgetaucht, aber es ist kein offizieller öffentlicher Modellname. So sollten Entwickler dieses Signal interpretieren.

7 min read
Gemini 4.0 auf Google I/O 2026: Was bestätigt ist, was aus anonymen Quellen stammt und worauf Entwickler wirklich achten sollten
gemini-4google

Gemini 4.0 auf Google I/O 2026: Was bestätigt ist, was aus anonymen Quellen stammt und worauf Entwickler wirklich achten sollten

Google I/O beginnt heute um 10 Uhr PT. Die Berichterstattung vor der Keynote über das neue Gemini reicht von 'inkrementellem 3.5-Release' bis hin zu 'vollständigem Gemini 4.0 mit tieferer Integration'. Hier ist, was tatsächlich bestätigt ist im Vergleich zu anonymen Quellen – und die sieben Dinge, die Entwickler sofort bewerten sollten, sobald die Modellkarte erscheint.

7 min read
Was ist OpenAI Glacier-Alpha? Was wir tatsächlich wissen

Was ist OpenAI Glacier-Alpha? Was wir tatsächlich wissen

Glacier-alpha tauchte in OpenAI-Leak-Diskussionen auf, aber es gibt keine offizielle Produktseite dafür. Hier ist, was Entwickler schlussfolgern sollten und was nicht.

8 min read
Seedance 2.1 und Seedance 2.0 Mini kommen: Qualitätsverbesserung, günstigere Preisstufe
seedancebytedance

Seedance 2.1 und Seedance 2.0 Mini kommen: Qualitätsverbesserung, günstigere Preisstufe

ByteDance bereitet zwei neue Seedance-Varianten vor: Seedance 2.1 mit einer gemeldeten Verbesserung der Generierungsqualität von ~20 % und eine neue Mini-Stufe, die deutlich unter dem aktuellen Seedance-Preis liegen soll und dabei Seedance 2.0 Fast übertreffen soll.

6 min read
Was DeepSeeks Finanzierungsgespräche für Modellplattformen bedeuten

Was DeepSeeks Finanzierungsgespräche für Modellplattformen bedeuten

DeepSeeks gemeldete Finanzierungsgespräche könnten mehr als nur einen Bewertungssprung signalisieren. Hier ist, was sie für die Preisgestaltungsmacht von Modellen und die Plattformstrategie bedeuten könnten.

9 min read
Warum Entwickler durchgesickerte Modellnamen ignorieren sollten

Warum Entwickler durchgesickerte Modellnamen ignorieren sollten

Durchgesickerte Modellnamen wie oai-2.1 erzeugen Rauschen, aber Produktionsteams brauchen Dokumentation, Preise, Limits und Support-Signale, bevor sie handeln.

8 min read
design.md vs. Design Tokens für KI-UI-Workflows

design.md vs. Design Tokens für KI-UI-Workflows

Vergleich von design.md und traditionellen Design Tokens für KI-UI-Workflows mit Fokus auf Lesbarkeit durch Agenten, Konsistenz und Workflow-Portabilität.

9 min read
Was ist ML Intern und warum vertikale Agenten wichtig sind

Was ist ML Intern und warum vertikale Agenten wichtig sind

ML Intern ist ein Open-Source-ML-Engineering-Agent, der für Forschungs- und Trainings-Workflows entwickelt wurde. Hier erfahren Sie, was er über die nächste Phase vertikaler Agenten aussagt.

9 min read
GPT-5.6 tauchte in OpenAIs Codex-Logs auf — was das wirklich bedeutet
gpt-5-6openai

GPT-5.6 tauchte in OpenAIs Codex-Logs auf — was das wirklich bedeutet

Ein einzelner Routing-Eintrag in den Codex-Rollout-Logs von OpenAI verwies auf GPT-5.6. Polymarket liegt bei 89 % für eine Veröffentlichung bis zum 30. Juni. Was bestätigt ist, was Rauschen ist und warum der Kobold-Vorfall der Grund dafür ist, dass die Tests so schnell voranschreiten.

7 min read