Phota Text-to-Image現已登陸WaveSpeedAI
photatext-to-image

Phota Text-to-Image現已登陸WaveSpeedAI

Phota Text-to-Image 能從文字提示生成高品質個性化照片。支援 4K 解析度、多種長寬比、批次生成及內建提示詞增強器。提供 REST API,每張圖片僅需 $0.09,無冷啟動延遲。

1 min read
LTX-2.3 定價解析:API 費用、本地推理與雲端方案比較(2026)

LTX-2.3 定價解析:API 費用、本地推理與雲端方案比較(2026)

詳解 LTX-2.3 API 定價:快速版與專業版差異、720p 與 1080p 方案比較、每秒費用分解,以及本地推理真正省錢的時機。

3 min read
PixVerse V6 正式發布:鏡頭控制、原生音訊與多鏡頭影片生成
pixversepixverse-v6

PixVerse V6 正式發布:鏡頭控制、原生音訊與多鏡頭影片生成

PixVerse V6 推出超過 20 種電影級鏡頭控制、帶有原生音訊的多鏡頭影片、15 秒 1080p 穩定輸出,以及適合開發者工作流程的 CLI 工具。了解 V6 帶來的新功能,以及您現在可以使用的最佳 AI 影片模型。

2 min read
Claude Mythos(Opus 5)洩露:目前我們所知道的一切
ai-modelsclaude

Claude Mythos(Opus 5)洩露:目前我們所知道的一切

Anthropic 的下一代 Claude Mythos 模型在一次資料洩露中曝光。以下是洩露文件中關於其編程、推理和網路安全能力的詳細內容,以及這對 AI 發展意味著什麼。

1 min read
Suno vs MiniMax Music vs Google Lyria 3:AI音樂生成全面比較
ai-musicsuno

Suno vs MiniMax Music vs Google Lyria 3:AI音樂生成全面比較

深入比較 Suno v5.5、MiniMax Music 2.5 與 Google Lyria 3 Pro 的 AI 音樂生成能力,涵蓋音質、人聲、創作控制、定價及 API 存取等面向。

5 min read
daVinci-MagiHuman:碾壓所有數位人生成器的開源模型
magihumandavinci

daVinci-MagiHuman:碾壓所有數位人生成器的開源模型

daVinci-MagiHuman 是一個 150 億參數的開源模型,能在單張 H100 上以 2 秒生成口型同步的說話人頭影片。勝率優於 Ovi 1.1(勝率 80%)與 LTX 2.3(勝率 60.9%),採用 Apache 2.0 授權,支援多語言,速度極快。

2 min read
daVinci MagiHuman Text-to-Video 現已登陸WaveSpeedAI
davinci-magihumansand-ai

daVinci MagiHuman Text-to-Video 現已登陸WaveSpeedAI

daVinci MagiHuman Text-to-Video 可從文字提示生成電影感十足的人物中心影片,支援可選音訊同步。150億參數開源模型,最高 1080p 畫質,影片長度 5-10 秒。提供 REST API,每秒 $0.04,無冷啟動延遲。

2 min read
daVinci MagiHuman Image-to-Video 現已登陸WaveSpeedAI
davinci-magihumansand-ai

daVinci MagiHuman Image-to-Video 現已登陸WaveSpeedAI

daVinci MagiHuman Image-to-Video 是一個 150 億參數的開源模型,可將參考圖片動畫化為電影級影片,並支援可選的音頻同步。效果媲美 WAN 2.5。解析度最高 1080p,時長 5-10 秒。REST API,$0.04/秒,無冷啟動。

1 min read
LTX-2.3 ComfyUI 設定指南:兩階段流程、VRAM 修復與 Gemma 編碼器

LTX-2.3 ComfyUI 設定指南:兩階段流程、VRAM 修復與 Gemma 編碼器

在 ComfyUI 中設定 LTX-2.3:檢查點放置、Gemma 3 12B 編碼器配置、兩階段生成流程,以及適用於消費級 GPU 的低 VRAM 策略。

3 min read
LTX-2.3 LoRA 訓練指南:風格、動作與 IC-LoRA 控制(2026)

LTX-2.3 LoRA 訓練指南:風格、動作與 IC-LoRA 控制(2026)

使用官方 ltx-trainer 在 LTX-2.3 上訓練自定義 LoRA。涵蓋風格 LoRA、IC-LoRA 結構控制、rank 設定、資料集準備及常見訓練失敗問題。

2 min read
Google Lyria 3 Clip現已登陸WaveSpeedAI
lyriagoogle

Google Lyria 3 Clip現已登陸WaveSpeedAI

Google Lyria 3 Clip 可根據歌詞、描述及音頻等文字提示生成完整音樂曲目,支援圖像引導生成、負面提示詞及可重現結果。提供 REST API,每段剪輯僅需 $0.04,無冷啟動延遲。

1 min read
Google Lyria 3 Pro現已登陸WaveSpeedAI
lyriagoogle

Google Lyria 3 Pro現已登陸WaveSpeedAI

Google Lyria 3 Pro可生成高品質AI音樂,擁有比Clip層級更豐富的樂器編排、細膩的情感表達與更高的音訊保真度。支援文字與圖像引導的音樂創作。REST API,每段$0.08,無冷啟動延遲。

2 min read