#model-release
346 articles - Page 20
ByteDance Dreamina V3.0 Edit が WaveSpeedAI に登場
ByteDance Dreamina 3.0 Edit は、美学、スタイル、ディテールを強化し、テキストプロンプトを受け付ける画像変換モデルです。すぐに使える REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDance Dreamina V3.0 テキスト-画像生成がWaveSpeedAIで利用可能に
ByteDance Dreamina V3.0は、アップグレードされたビジュアルエフェクト、より豊かな詳細性、改善されたスタイル精度を強調したテキスト-画像モデルで、テキストプロンプトからより美的で忠実な画像を生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDance Dreamina V3.1 テキスト-画像生成がWaveSpeedAIで利用可能に
ByteDance Dreamina V3.1は、美的品質とスタイル精度が向上したテキスト-画像生成モデルで、より豊かでポーランドされた画像を生成します。すぐに使用可能なREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceのLipSyncオーディオ・ツー・ビデオがWaveSpeedAIで利用可能に
ByteDanceのLipSyncは、入力オーディオに完全に同期した正確なリップムーブメントを生成することで、オーディオをリアルな話す動画に変換します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceビデオアップスケーラーがWaveSpeedAIに登場
ByteDanceビデオアップスケーラーはAIスーパー解像度を使用して、ビデオを4Kにアップスケールし、セキュアなクラウド環境で細部のディテールを復元します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceのUsoがWaveSpeedAIに登場
ByteDanceのUSO(Unified Style-Subject Optimized)は、スタイル駆動型と被写体駆動型の生成を統合し、芸術的スタイルと被写体の忠実性をブレンドした一貫性のある出力を生成します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Eleven V3がWaveSpeedAIに登場
ElevenLabs eleven-v3は、ホストされたエンドポイントとして利用可能なテキスト音声変換モデルです。リクエストは1000文字あたり$0.1の費用がかかります。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ElevenLabs Flash V2.5がWaveSpeedAIに登場
ElevenLabs Flash V2は、ElevenLabsのFlash V2エンジンを使用してテキストを音声に変換するテキスト読み上げモデルです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Flash V2がWaveSpeedAIに登場
ElevenLabs Flash V2は、ElevenLabs Flash V2エンジンを使用してテキストを音声に変換するテキスト音声合成モデルです。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Eleven V3 TimingがWaveSpeedAIに登場
ElevenLabs Eleven-V3 Timingはテキストを自然な音声に変換し、アライメントメタデータ(JSON形式の文字/単語タイムスタンプ)を返します。正確な字幕、カラオケエフェクト、リップシンクに対応。voice_id、相似度/安定性、オプションのSpeaker Boostをサポート。1,000文字あたり$0.10で価格設定。すぐに使用可能
ElevenLabs Multilingual V1がWaveSpeedAIに登場
ElevenLabs Multilingual V1は、多くの言語にわたって自然な音声の多言語テキスト音声変換を提供します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ElevenLabs Multilingual V2がWaveSpeedAIに登場
ElevenLabsの多言語音声合成モデルMultilingual V2は、1000文字あたり0.1ドルのコストで利用可能。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。