WaveSpeed 部落格

說得更聰明，說得更順暢：MiniMax Speech 2.6 的到來

曾經有一段時間，與 AI 對話總是感覺有點不對勁——節奏太死板，語調太平淡，溫暖感始終差一點。但現在，隨著 MiniMax Speech 2.6 系列——包括 Speech 2.6 Turbo 和 Speech 2.6 HD——在 WaveSpeedAI 上線，發生了一些非凡的變化：AI 的聲音終於活了起來。

Apr 22, 2025 1 min read

seedancebytedance

Seedance 1.5 Pro：邁向原生音視訊生成的重大進展

隨著生成式影片進入實際生產階段，單有視覺效果已經不夠。現代工作流程越來越需要影片和音訊一起生成——原生且同步。ByteDance 的下一代原生音視訊協同生成模型 Seedance 1.5 Pro，現已在 WaveSpeedAI 上推出。

Apr 21, 2025 2 min read

seedreambytedance

Seedream 4.0：新一代多模態影像模型

在過去一週，Nano-Banana 的病毒式傳播主導了頭條新聞，表明多模態 AI 正以前所未有的速度進入公眾意識。然而，這些討論往往仍局限於研究和探索階段，距離真正的企業級實施還有一定距離。

Apr 20, 2025 1 min read

seedreambytedance

Seedream4.5 現已登陸WaveSpeedAI

WaveSpeedAI 已正式集成 ByteDance 的 Seedream4.5，將最先進的多模態影像生成模型之一帶到其平台上。Seedream4.5 提供更銳利的細節、更高的穩定性，以及對複雜提示詞更準確的理解。

Apr 18, 2025 2 min read

seedreambytedance

速度還是規模？Nano Banana Pro vs Qwen Image for 創意專業人士

Google Nano Banana Pro (Gemini 3.0 Pro Image) 和 Seedream 4 的簡明比較，重點強調創意專業人士的速度、逼真度和工作流程優勢。

Apr 17, 2025 2 min read

qwenalibaba

停止手動遮罩圖像：使用 Qwen-Image Layered 建立乾淨的 RGBA 圖層

Qwen-Image Layered 是一個提示引導的圖像分解模型，能將單一圖像分割成多個乾淨的 RGBA 圖層，每個圖層都具有適當的透明度、柔和邊緣和正確的遮擋順序——可立即用於實際生產工作流程。

Apr 15, 2025 2 min read

wanalibaba

停止訓練，開始創作：在 WaveSpeedAI 上使用 LoRA

什麼是 LoRA？可以將其視為一種輕量級微調方法：與其重新訓練整個模型，不如簡單地向現有模型添加一個小型「快速適應」層來鎖定您自己的風格 — 更快更便宜。

Apr 14, 2025 3 min read

replicatewavespeedai

The Dream Team Is Ready. What’s Your Big Idea?

A groundbreaking idea deserves more than just a tool—it deserves a dream team.

Apr 11, 2025 1 min read

video-generationwavespeedai

WaveSpeedAI：多模態AIGC平台解鎖無限創意

多模態AIGC平台解鎖無限創意

Apr 9, 2025 2 min read

wanalibaba

AI 影片的下一步：認識 Wan 2.5

在過去幾年，AI 影片生成經歷了幾波創新浪潮——首先是更流暢的動作，然後是更高的視覺清晰度。

Apr 8, 2025 2 min read

wanalibaba

利用阿里巴巴 WAN 2.6 解鎖下一代影片創作 - 现已登陆WaveSpeedAI

阿里巴巴的 WAN 2.6 模型現已在 WaveSpeedAI 上線，為創作者提供更強大的故事講述能力、更智能的參考驅動生成和更長、更富表現力的輸出。我們強調了定義 WAN 2.6 的三個核心功能。

Apr 5, 2025 1 min read

veogoogle

Veo 3.1 现已登陆WaveSpeedAI

全球多模態推理加速平台 WaveSpeedAI 今日宣佈推出 Veo 3.1 —— Google 最新的視頻和音頻生成模型 —— 現已透過 WaveSpeedAI API 提供使用。

Apr 4, 2025 1 min read