#digital-human
39 articles - Page 2
WaveSpeedAI InfiniteTalk Fast がWaveSpeedAIに登場
InfiniteTalk Fast は1枚の写真と音声から、音声駆動のトーキングまたはシンギングアバタービデオ(Image-to-Video)を生成します。最大10分まで対応。すぐに使えるREST API、コールドスタートなし、手頃な価格設定。
PixVerse LipSyncがWaveSpeedAIに登場
PixVerse LipSyncは高度なアルゴリズムで音声をリアルなリップシンク動画に変換し、正確な口の動きとタイミングをビデオアバターに実現します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Sync LipSync 2がWaveSpeedAIに登場
Sync Lipsync-2は、提供されたオーディオに合わせて任意のビデオのリップシンクを同期し、映画、ポッドキャスト、ゲーム、アニメーションのための現実的な口の動きの調整を可能にします。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Veed LipSyncがWaveSpeedAIに登場
Veed LipSyncを使用して、音声から高品質な同期を備えたリアルなリップシンク動画を生成します。動画5秒あたり$0.15。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
Hunyuan AvatarがWaveSpeedAIに登場
Hunyuan Avatarは1枚の画像と音声から音声駆動のトーキングまたはシンギングビデオを作成します。480p/720pで最大120秒対応(5秒あたり$0.15から)。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
WAN 2.2 Speech To VideoがWaveSpeedAIに登場
Wan-2.2-S2Vは画像と音声を高忠実度ビデオに変換し、リアルな顔と体の動きをサポート。480pで最大10分のクリップに対応し、$0.15/5秒から利用可能。すぐに使えるREST API、コールドスタートなし、手頃な価格。
ByteDance Avatar Omni Human 1.5がWaveSpeedAIで利用可能に
OmniHuman 1.5は、オーディオと視覚的な手がかりをリアルなアバターアニメーションに変換し、バーチャルヒューマン、ストーリーテリング、インタラクティブエージェント向けに対応しています。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。
ByteDanceアバターOmniHumanがWaveSpeedAIに登場
ByteDanceのOmniHumanは、1枚のポートレート写真をリアルな動きと表情を持つアバタービデオに変換します($0.12/秒)。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
Image Effects My WorldがWaveSpeedAIに登場
My-Worldは写真をマインクラフト風のピクセルアートに変換し、ゲームのブロック状のピクセル化された美学を再現します。すぐに使用可能なREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
動画エフェクト「カートゥーン人形」がWaveSpeedAIに登場
写真をなめらかで楽しいアニメーションのちび風漫画人形ビデオに変換します。アバターとソーシャルメディアクリップ向けの画像からビデオへのエフェクト。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ByteDanceのLipSyncオーディオ・ツー・ビデオがWaveSpeedAIで利用可能に
ByteDanceのLipSyncは、入力オーディオに完全に同期した正確なリップムーブメントを生成することで、オーディオをリアルな話す動画に変換します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。
ElevenLabs Eleven V3 TimingがWaveSpeedAIに登場
ElevenLabs Eleven-V3 Timingはテキストを自然な音声に変換し、アライメントメタデータ(JSON形式の文字/単語タイムスタンプ)を返します。正確な字幕、カラオケエフェクト、リップシンクに対応。voice_id、相似度/安定性、オプションのSpeaker Boostをサポート。1,000文字あたり$0.10で価格設定。すぐに使用可能