腾讯发布并开源混元语音数字人模型

新榜出品

腾讯发布并开源混元语音数字人模型

发布时间：2025/05/28

新榜讯 5月28日消息，腾讯混元正式发布并开源语音数字人模型HunyuanVideo - Avatar。

新榜讯 5月28日消息，腾讯混元正式发布并开源语音数字人模型HunyuanVideo - Avatar。该模型由腾讯混元视频大模型（HunyuanVideo）与腾讯音乐天琴实验室MuseV技术联合研发而成。它具备强大功能，支持头肩、半身与全身景别，可适用于多风格、多物种与双人场景，能为视频创作者提供高一致性、高动态性的视频生成能力。用户只需上传人物图像与音频，HunyuanVideo - Avatar模型便能自动对图片和音频进行解析，包括识别出人物所处环境、音频蕴含的情感等，进而让图中人物自然地说话或唱歌，生成带有自然表情、唇形同步且包含全身动作的视频。(财联社)