#digital-human

37 articles

daVinci-MagiHuman：あらゆるデジタルヒューマン生成モデルを圧倒したオープンソースモデル

daVinci-MagiHumanは150億パラメータのオープンソースモデルで、単一のH100で2秒以内にリップシンク付きトーキングヘッド動画を生成します。Ovi 1.1（勝率80%）およびLTX 2.3（勝率60.9%）を凌駕。Apache 2.0ライセンス、多言語対応、超高速処理を実現。

2026-03-27 2 分で読める

daVinci MagiHuman Image-to-VideoがWaveSpeedAIに登場

daVinci MagiHuman Image-to-Videoは150億パラメータのオープンソースモデルで、参照画像を映画品質の動画にアニメーション化し、オプションで音声同期にも対応しています。WAN 2.5と同等の性能を発揮。最大1080p、5〜10秒の動画を生成可能。REST API対応、$0.04/秒、コールドスタートなし。

2026-03-27 1 分で読める

daVinci MagiHuman Text-to-VideoがWaveSpeedAIに登場

daVinci MagiHuman Text-to-Videoは、テキストプロンプトからシネマティックな人物中心の動画を生成し、オプションの音声同期にも対応。150億パラメータのオープンソースモデルで、最大1080p・5〜10秒の動画を出力。REST API対応、$0.04/秒、コールドスタートなし。

2026-03-27 1 分で読める

InfiniteTalk Fast Video-to-Video MultiがWaveSpeedAIに登場

InfiniteTalk Fastのマルチキャラクター口パク同期は、動画と2つの音声トラックをリアルなトーキング・歌唱動画に変換します。標準より50%低コストで、最大10分まで対応。すぐに使えるREST推論API、高パフォーマンス、コールドスタートなし、リーズナブルな価格設定。

2026-03-18 1 分で読める

InfiniteTalk Video-to-Video MultiがWaveSpeedAIに登場

InfiniteTalk Video-to-Video Multiは、動画と2つの音声入力からリアルなマルチキャラクターのリップシンク動画を生成します。480p/720pに対応し、最大10分、全身の一貫性を維持。すぐに使えるREST推論API、最高のパフォーマンス、コールドスタートなし、リーズナブルな価格設定。

2026-03-18 1 分で読める

SkyReels V3 Talking Avatar：1枚の写真からAIトーキングヘッド動画を生成

SkyReels V3 Talking Avatarは、1枚のポートレート写真と音声からリアルなトーキングヘッド動画を生成します。40以上の言語のリップシンクに対応。WaveSpeedAIでお試しください。

2026-03-03 2 分で読める

SoulX FlashHead：96 FPSのリアルタイムAIトーキングヘッドがWaveSpeedAIに登場

SoulX FlashHeadは、アイデンティティのずれなしに96 FPSでリアルタイムストリーミングのトーキングヘッド動画を生成します。無限長の動画に対応。WaveSpeedAIでお試しください。

2026-03-03 2 分で読める

LongCat AvatarがWaveSpeedAIに登場

LongCat Avatarは、超リアルなリップシンク機能を備えた長尺ビデオ生成を実現し、自然な動きと一貫性のあるアイデンティティを保ちます。1枚の写真とオーディオから、オーディオ駆動のトーキングまたはシンギングアバタービデオ(画像からビデオへ)を生成でき、最大1分、720p層は$0.30/5秒です。すぐに使えるREST API、コールドスタートなし

2025-12-26 1 分で読める