#announcement
534 articles - Page 32
ByteDance Dreamina V3.0 Image-to-Video 1080p が WaveSpeedAI で利用可能に
Dreamina V3.0 は、テキストまたは画像プロンプトを自然な表現、多様なスタイル、マルチシーンのナラティブを備えた 1080P ビデオに変換します。すぐに使用できる REST 推論 API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDance Dreamina V3.0 Image-to-Video 720p がWaveSpeedAIで利用可能に
Dreamina V3.0は、テキストまたは画像をプロフェッショナルな720Pビデオに変換し、自然なダイナミックな表現、多様なスタイル、マルチシーンのナラティブを実現します。すぐに使えるRESTオファーAPI、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDance Dreamina V3.0 テキスト-画像生成がWaveSpeedAIで利用可能に
ByteDance Dreamina V3.0は、アップグレードされたビジュアルエフェクト、より豊かな詳細性、改善されたスタイル精度を強調したテキスト-画像モデルで、テキストプロンプトからより美的で忠実な画像を生成します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDance Dreamina V3.1 テキスト-画像生成がWaveSpeedAIで利用可能に
ByteDance Dreamina V3.1は、美的品質とスタイル精度が向上したテキスト-画像生成モデルで、より豊かでポーランドされた画像を生成します。すぐに使用可能なREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceのLipSyncオーディオ・ツー・ビデオがWaveSpeedAIで利用可能に
ByteDanceのLipSyncは、入力オーディオに完全に同期した正確なリップムーブメントを生成することで、オーディオをリアルな話す動画に変換します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceのSeedream V4.5 SequentialがWaveSpeedAIに登場
Seedream 4.5 Sequentialは、一貫性のあるキャラクターとオブジェクトを備えた複数画像セットを生成し、すべての出力にわたってパレット、ライティング、スタイルを統一します。キャンペーン、ストーリーボード、製品ラインアップに対応し、4K結果までをサポートします。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格
ByteDanceビデオアップスケーラーがWaveSpeedAIに登場
ByteDanceビデオアップスケーラーはAIスーパー解像度を使用して、ビデオを4Kにアップスケールし、セキュアなクラウド環境で細部のディテールを復元します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceのUsoがWaveSpeedAIに登場
ByteDanceのUSO(Unified Style-Subject Optimized)は、スタイル駆動型と被写体駆動型の生成を統合し、芸術的スタイルと被写体の忠実性をブレンドした一貫性のある出力を生成します。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Eleven V3がWaveSpeedAIに登場
ElevenLabs eleven-v3は、ホストされたエンドポイントとして利用可能なテキスト音声変換モデルです。リクエストは1000文字あたり$0.1の費用がかかります。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ElevenLabs Flash V2.5がWaveSpeedAIに登場
ElevenLabs Flash V2は、ElevenLabsのFlash V2エンジンを使用してテキストを音声に変換するテキスト読み上げモデルです。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Flash V2がWaveSpeedAIに登場
ElevenLabs Flash V2は、ElevenLabs Flash V2エンジンを使用してテキストを音声に変換するテキスト音声合成モデルです。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Eleven V3 TimingがWaveSpeedAIに登場
ElevenLabs Eleven-V3 Timingはテキストを自然な音声に変換し、アライメントメタデータ(JSON形式の文字/単語タイムスタンプ)を返します。正確な字幕、カラオケエフェクト、リップシンクに対応。voice_id、相似度/安定性、オプションのSpeaker Boostをサポート。1,000文字あたり$0.10で価格設定。すぐに使用可能