#wavespeedai
320 articles
PixVerse V6 Extend 現已登陸WaveSpeedAI
PixVerse V6 Extend 能夠延續現有影片,透過生成與原始影片動態和風格相符的新畫格來延長影片。最高支援 1080p,可選音訊、風格控制。提供 REST API,費用低至 $0.025/秒,無冷啟動。
PixVerse V6 Image-to-Video現已登陸WaveSpeedAI
PixVerse V6 Image-to-Video可將任何照片轉化為電影級影片,支援1至15秒時長、最高1080p解析度、可選音訊及思考模式。提供REST API,每秒低至$0.025,無冷啟動延遲。
PixVerse V6文字生成影片現已登陸WaveSpeedAI
PixVerse V6文字生成影片可從文字提示產生高品質影片,支援1至15秒片長、最高1080p解析度、可選音訊,以及針對複雜場景的思考模式。提供REST API,每秒最低$0.025,無冷啟動問題。
PixVerse V6 Transition 現已登陸WaveSpeedAI
PixVerse V6 Transition 可在起始與結尾圖像之間生成流暢的 AI 影片轉場效果。支援多片段生成、風格控制、音訊,解析度最高達 1080p。提供 REST API,每秒最低 $0.025,無冷啟動。
Phota Edit現已登陸WaveSpeedAI
Phota Edit透過自然語言指令轉換圖像。支援最多10張參考圖片、4K輸出、靈活的長寬比與批次生成。REST API,每張圖片$0.09,無冷啟動延遲。
Phota Enhance 現已登陸WaveSpeedAI
Phota Enhance 是一款 AI 驅動的圖像超解析度工具,能從低品質照片中還原細膩紋理、銳利邊緣與遺失的細節。支援批次處理、4K 輸出、JPEG/PNG/WebP 格式。提供 REST API,每張圖片僅需 $0.09,無冷啟動延遲。
Phota Text-to-Image現已登陸WaveSpeedAI
Phota Text-to-Image 能從文字提示生成高品質個性化照片。支援 4K 解析度、多種長寬比、批次生成及內建提示詞增強器。提供 REST API,每張圖片僅需 $0.09,無冷啟動延遲。
PixVerse V6 正式發布:鏡頭控制、原生音訊與多鏡頭影片生成
PixVerse V6 推出超過 20 種電影級鏡頭控制、帶有原生音訊的多鏡頭影片、15 秒 1080p 穩定輸出,以及適合開發者工作流程的 CLI 工具。了解 V6 帶來的新功能,以及您現在可以使用的最佳 AI 影片模型。
daVinci-MagiHuman:碾壓所有數位人生成器的開源模型
daVinci-MagiHuman 是一個 150 億參數的開源模型,能在單張 H100 上以 2 秒生成口型同步的說話人頭影片。勝率優於 Ovi 1.1(勝率 80%)與 LTX 2.3(勝率 60.9%),採用 Apache 2.0 授權,支援多語言,速度極快。
daVinci MagiHuman Image-to-Video 現已登陸WaveSpeedAI
daVinci MagiHuman Image-to-Video 是一個 150 億參數的開源模型,可將參考圖片動畫化為電影級影片,並支援可選的音頻同步。效果媲美 WAN 2.5。解析度最高 1080p,時長 5-10 秒。REST API,$0.04/秒,無冷啟動。
daVinci MagiHuman Text-to-Video 現已登陸WaveSpeedAI
daVinci MagiHuman Text-to-Video 可從文字提示生成電影感十足的人物中心影片,支援可選音訊同步。150億參數開源模型,最高 1080p 畫質,影片長度 5-10 秒。提供 REST API,每秒 $0.04,無冷啟動延遲。
Google Lyria 3 Clip現已登陸WaveSpeedAI
Google Lyria 3 Clip 可根據歌詞、描述及音頻等文字提示生成完整音樂曲目,支援圖像引導生成、負面提示詞及可重現結果。提供 REST API,每段剪輯僅需 $0.04,無冷啟動延遲。