阿里通义首个音频生成模型ThinkSound正式开源_矩阵通

新榜出品

报告与资讯

进入矩阵通

当前位置矩阵通>行业资讯>正文

阿里通义首个音频生成模型ThinkSound正式开源

发布时间：2025/07/06

新榜讯 7月5日讯，阿里“通义大模型”公众号发布消息，通义实验室首个音频生成模型ThinkSound正式开源，此举将突破“静音画面”所带来的想象力限制。

新榜讯 7月5日讯，阿里“通义大模型”公众号发布消息，通义实验室首个音频生成模型ThinkSound正式开源，此举将突破“静音画面”所带来的想象力限制。ThinkSound开创性地将CoT应用于音频生成领域，促使AI能够逐步明晰画面事件与声音之间的关联，进而达成高保真、强同步的空间音频生成效果。这并非简单的“看图配音”，而是真正意义上的“听懂画面”。

往期推荐

抖音商城升级低价秒杀频道聚焦产业带民生产品

快手发布直播大舞台百城计划推出专属百亿流量

2025年7月淘宝天猫超级88招商规则发布

相关话题

小红书资讯

视频号资讯

即刻体验矩阵通，为企业搭建高效的新媒体矩阵管理系统

新媒体矩阵全链路管理

总部管理账号统筹运营任务数据监测与分析线索管理考核激励到人资产及经验留存

多场景功能全面赋能

风险检测竞对监测账号&矩阵评估内容创作 AI提效

联系我们

邮

箱

contact@newrank.cn

服

务

号

上海新榜信息技术股份有限公司

©2023 NEWRANK沪ICP备14042332号-2

沪公网安备31010402005073号