#digital-human

37 articles - Page 2

WaveSpeedAI InfiniteTalk Fast がWaveSpeedAIに登場

InfiniteTalk Fast は1枚の写真と音声から、音声駆動のトーキングまたはシンギングアバタービデオ（Image-to-Video）を生成します。最大10分まで対応。すぐに使えるREST API、コールドスタートなし、手頃な価格設定。

2025-11-21 1 分で読める

PixVerse LipSyncがWaveSpeedAIに登場

PixVerse LipSyncは高度なアルゴリズムで音声をリアルなリップシンク動画に変換し、正確な口の動きとタイミングをビデオアバターに実現します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-10-29 1 分で読める

Sync LipSync 2がWaveSpeedAIに登場

Sync Lipsync-2は、提供されたオーディオに合わせて任意のビデオのリップシンクを同期し、映画、ポッドキャスト、ゲーム、アニメーションのための現実的な口の動きの調整を可能にします。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-10-28 1 分で読める

Veed LipSyncがWaveSpeedAIに登場

Veed LipSyncを使用して、音声から高品質な同期を備えたリアルなリップシンク動画を生成します。動画5秒あたり$0.15。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。

2025-10-27 1 分で読める

Hunyuan AvatarがWaveSpeedAIに登場

Hunyuan Avatarは1枚の画像と音声から音声駆動のトーキングまたはシンギングビデオを作成します。480p/720pで最大120秒対応（5秒あたり$0.15から）。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-10-23 1 分で読める

WAN 2.2 Speech To VideoがWaveSpeedAIに登場

Wan-2.2-S2Vは画像と音声を高忠実度ビデオに変換し、リアルな顔と体の動きをサポート。480pで最大10分のクリップに対応し、$0.15/5秒から利用可能。すぐに使えるREST API、コールドスタートなし、手頃な価格。

2025-10-19 1 分で読める

ByteDance Avatar Omni Human 1.5がWaveSpeedAIで利用可能に

OmniHuman 1.5は、オーディオと視覚的な手がかりをリアルなアバターアニメーションに変換し、バーチャルヒューマン、ストーリーテリング、インタラクティブエージェント向けに対応しています。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。

2025-09-09 1 分で読める

ByteDanceアバターOmniHumanがWaveSpeedAIに登場

ByteDanceのOmniHumanは、1枚のポートレート写真をリアルな動きと表情を持つアバタービデオに変換します（$0.12/秒）。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-09-09 1 分で読める

ByteDanceのLipSyncオーディオ・ツー・ビデオがWaveSpeedAIで利用可能に

ByteDanceのLipSyncは、入力オーディオに完全に同期した正確なリップムーブメントを生成することで、オーディオをリアルな話す動画に変換します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-08-13 1 分で読める

ElevenLabs Eleven V3 TimingがWaveSpeedAIに登場

ElevenLabs Eleven-V3 Timingはテキストを自然な音声に変換し、アライメントメタデータ（JSON形式の文字/単語タイムスタンプ）を返します。正確な字幕、カラオケエフェクト、リップシンクに対応。voice_id、相似度/安定性、オプションのSpeaker Boostをサポート。1,000文字あたり$0.10で価格設定。すぐに使用可能

2025-08-10 1 分で読める

ByteDanceのLatentSyncがWaveSpeedAIで利用開始

ByteDanceのLatentSyncはStable DiffusionとTREPAを組み合わせ、高解像度のエンドツーエンドリップシンク機能を提供し、生成ビデオで正確でリアルな口の動きを実現します。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格設定。

2025-07-17 1 分で読める

WaveSpeedAI Sam 3d BodyがWaveSpeedAIに登場

画像から詳細な3Dヒューマンボディモデルを作成するための高度なSAM 3Dボディ生成モデル。オプションのマスクベースセグメンテーション対応。すぐに使用できるREST推論API、最高のパフォーマンス、コールドスタートなし、手頃な価格。

2025-07-16 1 分で読める