PixVerse V6 正式发布:摄像机控制、原生音频与多镜头视频生成
pixversepixverse-v6

PixVerse V6 正式发布:摄像机控制、原生音频与多镜头视频生成

PixVerse V6 推出20+电影级镜头控制、原生音频多镜头视频、15秒1080p稳定输出及开发者CLI工作流支持。了解V6带来的全新功能,以及现在可用的最佳AI视频模型。

2 min read
Claude Mythos(Opus 5)泄露:我们目前所知道的一切
ai-modelsclaude

Claude Mythos(Opus 5)泄露:我们目前所知道的一切

Anthropic 的下一代 Claude Mythos 模型在一次数据泄露中被曝光。以下是泄露文件中关于其编码、推理和网络安全能力的内容——以及这对 AI 意味着什么。

2 min read
Suno vs MiniMax Music vs Google Lyria 3:AI音乐生成对比评测
ai-musicsuno

Suno vs MiniMax Music vs Google Lyria 3:AI音乐生成对比评测

深度对比Suno v5.5、MiniMax Music 2.5和Google Lyria 3 Pro的AI音乐生成能力——涵盖音质、人声、创作控制、定价及API访问。

4 min read
daVinci-MagiHuman:碾压所有数字人生成器的开源模型
magihumandavinci

daVinci-MagiHuman:碾压所有数字人生成器的开源模型

daVinci-MagiHuman 是一个 150 亿参数的开源模型,能在单张 H100 上 2 秒内生成唇形同步的说话头像视频。胜过 Ovi 1.1(80% 胜率)和 LTX 2.3(60.9%),采用 Apache 2.0 许可,支持多语言,速度极快。

2 min read
daVinci MagiHuman图像转视频现已登陆WaveSpeedAI
davinci-magihumansand-ai

daVinci MagiHuman图像转视频现已登陆WaveSpeedAI

daVinci MagiHuman图像转视频是一款150亿参数的开源模型,可将参考图像动画化为电影级视频,并支持可选音频同步。性能媲美WAN 2.5。最高支持1080p分辨率,时长5至10秒。提供REST API,价格为$0.04/秒,无冷启动。

2 min read
daVinci MagiHuman Text-to-Video现已登陆WaveSpeedAI
davinci-magihumansand-ai

daVinci MagiHuman Text-to-Video现已登陆WaveSpeedAI

daVinci MagiHuman Text-to-Video可从文本提示生成以人物为核心的电影级视频,支持可选音频同步。150亿参数开源模型,分辨率最高1080p,时长5至10秒。提供REST API,定价$0.04/秒,无冷启动。

1 min read
LTX-2.3 ComfyUI 配置指南:两阶段流水线、显存优化与 Gemma 编码器

LTX-2.3 ComfyUI 配置指南:两阶段流水线、显存优化与 Gemma 编码器

在 ComfyUI 中配置 LTX-2.3:检查点放置、Gemma 3 12B 编码器设置、两阶段生成流水线,以及面向消费级 GPU 的低显存解决方案。

2 min read
LTX-2.3 LoRA训练指南:风格、动作与IC-LoRA控制(2026)

LTX-2.3 LoRA训练指南:风格、动作与IC-LoRA控制(2026)

使用官方ltx-trainer在LTX-2.3上训练自定义LoRA。涵盖风格LoRA、IC-LoRA结构控制、秩设置、数据集准备及常见训练失败问题。

2 min read
Google Lyria 3 Clip 现已登陆WaveSpeedAI
lyriagoogle

Google Lyria 3 Clip 现已登陆WaveSpeedAI

Google Lyria 3 Clip 可根据文本提示、歌词、描述和音频生成完整音乐曲目。支持图像引导生成、负向提示词及可复现结果。REST API 接入,每段仅需 $0.04,无冷启动延迟。

1 min read
Google Lyria 3 Pro现已登陆WaveSpeedAI
lyriagoogle

Google Lyria 3 Pro现已登陆WaveSpeedAI

Google Lyria 3 Pro可生成高品质AI音乐,相比Clip层级拥有更丰富的编曲、更细腻的表达与更高的音频保真度。支持文本与图像引导的音乐创作。REST API,每段$0.08,无冷启动。

1 min read
LTX-2.3 vs WAN 2.2:开源视频模型对比(2026)

LTX-2.3 vs WAN 2.2:开源视频模型对比(2026)

LTX-2.3 与 WAN 2.2 全面对比:速度、分辨率、原生音频、ComfyUI 生态成熟度及授权许可。哪款开源视频模型更适合您的生产工作流?

2 min read
LTX-2 升级至 LTX-2.3:兼容性、LoRA 变更与迁移指南(2026)

LTX-2 升级至 LTX-2.3:兼容性、LoRA 变更与迁移指南(2026)

已在使用 LTX-2?本文介绍升级至 LTX-2.3 前需了解的变更内容、注意事项及验证步骤,涵盖模型大小、ComfyUI 节点、LoRA 兼容性及 API 差异。

3 min read