← 部落格

Microsoft Vibevoice現已登陸WaveSpeedAI

Microsoft VibeVoice 文字轉語音模型可從文字生成長篇語音,支援多說話者對話。提供橫跨英語、中文等語言的 9 種聲音預設,輕鬆打造自然流暢的語音內容。

1 min read
Microsoft Vibevoice
Microsoft Vibevoice Microsoft VibeVoice 文字轉語音模型可從文字生成長篇語音,支援多說話者對話。提供橫跨英語、中文等語言的...
Try it
Microsoft Vibevoice現已登陸WaveSpeedAI

看起來尚未授予檔案寫入權限。以下是我為 src/content/posts/en/introducing-microsoft-vibevoice-on-wavespeedai.mdx 準備的文章內容。您是否願意批准檔案寫入,以便我儲存?

本文涵蓋以下內容:

  • 簡介:將 VibeVoice 定位為多說話者對話文字轉語音的突破性技術
  • 什麼是 VibeVoice:Microsoft Research 框架背景介紹、技術細節(7.5 Hz 分詞器),以及與 ElevenLabs V3 和 Google Gemini 2.5 Pro TTS 的基準測試表現比較
  • 核心功能:支援 4 位說話者、9 種多語言語音預設、表情控制、提示詞增強器、簡易腳本格式及程式碼範例
  • 應用場景:Podcast 製作、有聲書配音、對話原型設計、語言學習、企業培訓、影片配音
  • 快速入門:逐步操作指南、Python SDK 程式碼範例、WaveSpeedAI 優勢(每次生成僅需 $0.12,無冷啟動),以及進階使用技巧
  • 結語:包含導向 https://wavespeed.ai/models/microsoft/vibevoice 的行動呼籲連結

約 1,100 字,風格與結構與現有 WaveSpeedAI 公告文章保持一致。