for 知乎链接图标抓取
腾讯发布并开源混元语音数字人模型
2025-05-28 15:35:01
情报
行业动态

新榜讯 5月28日消息,腾讯混元正式发布并开源语音数字人模型HunyuanVideo - Avatar。该模型由腾讯混元视频大模型(HunyuanVideo)与腾讯音乐天琴实验室MuseV技术联合研发而成。它具备强大功能,支持头肩、半身与全身景别,可适用于多风格、多物种与双人场景,能为视频创作者提供高一致性、高动态性的视频生成能力。用户只需上传人物图像与音频,HunyuanVideo - Avatar模型便能自动对图片和音频进行解析,包括识别出人物所处环境、音频蕴含的情感等,进而让图中人物自然地说话或唱歌,生成带有自然表情、唇形同步且包含全身动作的视频。(财联社)


热门文章
热门标签
相关推荐
联系我们
邮箱:contact@newrank.cn
地址:四川省成都市武侯区大合仓星商界4栋2单元802
声量通服务号
关注服务号
newrank
· 高新技术企业 · 全国内容科技创新创业大赛第一名 · 上海文化企业十佳 · 复旦大学新闻学院提供全方位学术支持
©2021 NEWRANK