#model-release

317 articles - Page 20

Vidu Image-to-Video Q2 TurboがWaveSpeedAIに登場

Vidu Q2 Turbo Image-to-Videoは、1枚の画像から滑らかなシネマティック動画を素早く高品質で生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-182 分で読める

Vidu Reference To Video Q2がWaveSpeedAIに登場

Vidu Q2は、微妙な顔の表情とスムーズなパン・ズーム・カメラ動作で自然な動きを強調するImage-to-VideoおよびReference-to-Videoモデルです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。

2025-08-171 分で読める

ViduテンプレートハロウィンがWaveSpeedAIに登場

Viduハロウィンテンプレートは、オーバーレイを備えたお化け屋敷プロモーションとイベント招待用の既製画像およびビデオテンプレートを提供します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-172 分で読める

ByteDanceのLipSyncオーディオ・ツー・ビデオがWaveSpeedAIで利用可能に

ByteDanceのLipSyncは、入力オーディオに完全に同期した正確なリップムーブメントを生成することで、オーディオをリアルな話す動画に変換します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-131 分で読める

ByteDanceビデオアップスケーラーがWaveSpeedAIに登場

ByteDanceビデオアップスケーラーはAIスーパー解像度を使用して、ビデオを4Kにアップスケールし、セキュアなクラウド環境で細部のディテールを復元します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-121 分で読める

ByteDanceのUsoがWaveSpeedAIに登場

ByteDanceのUSO（Unified Style-Subject Optimized）は、スタイル駆動型と被写体駆動型の生成を統合し、芸術的スタイルと被写体の忠実性をブレンドした一貫性のある出力を生成します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-111 分で読める

ElevenLabs Eleven V3がWaveSpeedAIに登場

ElevenLabs eleven-v3は、ホストされたエンドポイントとして利用可能なテキスト音声変換モデルです。リクエストは1000文字あたり$0.1の費用がかかります。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。

2025-08-111 分で読める

ElevenLabs Flash V2.5がWaveSpeedAIに登場

ElevenLabs Flash V2は、ElevenLabsのFlash V2エンジンを使用してテキストを音声に変換するテキスト読み上げモデルです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-111 分で読める

ElevenLabs Flash V2がWaveSpeedAIに登場

ElevenLabs Flash V2は、ElevenLabs Flash V2エンジンを使用してテキストを音声に変換するテキスト音声合成モデルです。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-111 分で読める

ElevenLabs Eleven V3 TimingがWaveSpeedAIに登場

ElevenLabs Eleven-V3 Timingはテキストを自然な音声に変換し、アライメントメタデータ（JSON形式の文字/単語タイムスタンプ）を返します。正確な字幕、カラオケエフェクト、リップシンクに対応。voice_id、相似度/安定性、オプションのSpeaker Boostをサポート。1,000文字あたり$0.10で価格設定。すぐに使用可能

2025-08-101 分で読める