#digital-human
39 articles - Page 2
WaveSpeedAI InfiniteTalk Fast 现已登陆WaveSpeedAI
InfiniteTalk Fast 将一张照片 + 音频转换为音频驱动的说话或唱歌虚拟形象视频(图像转视频),最长可达 10 分钟。即用型 REST API,无冷启动,价格实惠。
PixVerse LipSync 现已登陆WaveSpeedAI
PixVerse LipSync 使用先进算法将音频转换为逼真的唇形同步动画,精确控制嘴部运动和视频头像的时序。提供即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。
Sync LipSync 2 现已登陆WaveSpeedAI
Sync Lipsync-2 将任何视频中的唇形同步到提供的音频,为电影、播客、游戏或动画实现逼真的嘴型对齐。提供即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。
Veed LipSync 现已登陆WaveSpeedAI
使用 Veed LipSync 从音频生成逼真的口型同步动画,具有高质量同步效果;每 5 秒视频仅需 $0.15。随时可用的 REST 推理 API、最佳性能、无冷启动、价格实惠。
WaveSpeedAI浑元虚拟人现已登陆WaveSpeedAI
浑元虚拟人从单张图片+音频创建音频驱动的说话或唱歌视频,支持480p/720p分辨率,最长120秒(起价$0.15/5秒)。开箱即用的REST推理API,最佳性能,无冷启动,价格实惠。
WAN 2.2 语音转视频功能现已登陆WaveSpeedAI
Wan-2.2-S2V将图像和语音转换为高保真视频,具有逼真的面部和身体动作;支持长达10分钟的480p视频片段,价格仅需$0.15/5秒。随时可用的REST API,无冷启动,价格实惠。
字节跳动Avatar Omni Human 1.5 现已登陆WaveSpeedAI
OmniHuman 1.5将音频和视觉线索转换为逼真的虚拟人物动画,适用于虚拟人类、故事讲述和交互代理。现成的REST推理API、最佳性能、无冷启动、价格实惠。
字节跳动 Avatar Omni Human 现已登陆WaveSpeedAI
字节跳动 OmniHuman 可将单个肖像照片转换为具有逼真运动和表情的化身视频($0.12/秒)。开箱即用的 REST 推理 API、最佳性能、无冷启动、价格实惠。
Image Effects My World 现已登陆WaveSpeedAI
My-World 将照片转换为我的世界风格的像素艺术,重现游戏的方形像素美学。即用型 REST 推理 API,最佳性能,无冷启动,价格实惠。
视频效果卡通娃娃现已登陆WaveSpeedAI
将照片转换为Q版卡通娃娃视频,具有流畅、俏皮的动画效果。适用于头像和社交媒体剪辑的图像到视频效果。随时可用的REST推理API,最佳性能,无冷启动,价格实惠。
字节跳动 LipSync 音频转视频现已登陆WaveSpeedAI
字节跳动 LipSync 通过生成精确的唇动与输入音频完全同步,将音频转换为逼真的说话视频。提供即用型 REST 推理 API、最佳性能、无冷启动、价格实惠。
ElevenLabs Eleven V3 Timing 现已登陆WaveSpeedAI
ElevenLabs Eleven-V3 Timing将文本转换为自然语音,并返回对齐元数据——JSON格式的字符/单词时间戳——用于精确字幕、卡拉OK效果和唇同步。支持voice_id、相似度/稳定性和可选的Speaker Boost。价格为每1000个字符0.10美元。随时可用