腾讯混元视频生成工具开源:开启创意视频新时代

2025 年 5 月 9 日,腾讯正式推出并开源全新的多模态定制化视频生成工具 HunyuanCustom,基于混元视频生成大模型(HunyuanVideo)打造,在主体一致性效果上超越现有开源方案。
腾讯混元视频生成工具开源:开启创意视频新时代

腾讯混元视频生成工具开源:开启创意视频新时代

强大的多模态融合能力 HunyuanCustom 融合文本、图像、音频、视频等多模态输入,能实现单主体和多主体视频生成、单主体视频配音、视频局部编辑等功能,确保生成视频与用户输入的参考主体高度一致。用户上传一张图片并提供文本描述,如 “他正在遛狗”,就能生成相应视频。它还能实现多主体视频生成,如根据人物和物体照片及文字描述,让两者按要求出现在视频里。
出色的扩展性与创新应用 在音频驱动模式下,上传人物图像并配上音频,可生成人物在任意场景中说话、唱歌等音视频同步效果,适用于数字人直播、虚拟客服、教育演示等场景。视频驱动模式则支持将图片中的人物或物体自然地替换或插入到任意视频片段中,进行创意植入或场景扩展。
满足多样化需求 HunyuanCustom 能满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户的需求。在广告场景中,可快速变换商品背景、模特换衣服;在电商和客服场景中,能制作数字人商品介绍视频和特定穿着的数字人客服视频;在影视场景中,可快速制作短剧和小故事短视频。
卓越的可控性与一致性 HunyuanCustom 具有较强的控制信号跟随能力,可遵循文本、参考主体图像和语音等多种模态信号的控制,生成用户需要的对象、场景和动作。其主体一致性建模能力强,在单人、非人物体、多主体交互等场景中,能保持身份特征在视频全程的一致性与连贯性。
领先的视频生成质量 得益于腾讯混元视频大模型,HunyuanCustom 在人物细节还原、动作流畅性、光影真实度等方面达到业内领先水平,无论是生成虚拟数字人、打造品牌广告视频,还是进行创意视觉表达,都能提供高水准输出。
HunyuanCustom 的开源,为视频创作领域带来了全新的可能性,将推动创意视频的快速发展和广泛应用。
版权声明:AI工具箱导航 发表于 2025-05-09 18:20:56。
转载请务必标明出处:腾讯混元视频生成工具开源:开启创意视频新时代 | AI工具箱导航