当前位置矩阵通>行业资讯>正文
腾讯发布并开源混元语音数字人模型
发布时间:2025/05/28
新榜讯 5月28日消息,腾讯混元正式发布并开源语音数字人模型HunyuanVideo - Avatar。

新榜讯 5月28日消息,腾讯混元正式发布并开源语音数字人模型HunyuanVideo - Avatar。该模型由腾讯混元视频大模型(HunyuanVideo)与腾讯音乐天琴实验室MuseV技术联合研发而成。它具备强大功能,支持头肩、半身与全身景别,可适用于多风格、多物种与双人场景,能为视频创作者提供高一致性、高动态性的视频生成能力。用户只需上传人物图像与音频,HunyuanVideo - Avatar模型便能自动对图片和音频进行解析,包括识别出人物所处环境、音频蕴含的情感等,进而让图中人物自然地说话或唱歌,生成带有自然表情、唇形同步且包含全身动作的视频。(财联社)


即刻体验矩阵通,为企业搭建高效的新媒体矩阵管理系统
申请试用
上海新榜信息技术股份有限公司
©2023 NEWRANK沪ICP备14042332号-2
沪公网安备31010402005073号
矩阵ACE地图