阿里通义首个音频生成模型ThinkSound正式开源

客户故事

报告与资讯

申请演示

新榜

试用

关于
我们

报告与资讯|热点资讯|报告详情

阿里通义首个音频生成模型ThinkSound正式开源

2025-07-06 19:25:00

情报行业动态

新榜讯 7月5日讯，阿里“通义大模型”公众号发布消息，通义实验室首个音频生成模型ThinkSound正式开源，此举将突破“静音画面”所带来的想象力限制。ThinkSound开创性地将CoT应用于音频生成领域，促使AI能够逐步明晰画面事件与声音之间的关联，进而达成高保真、强同步的空间音频生成效果。这并非简单的“看图配音”，而是真正意义上的“听懂画面”。

原文链接：https://voice.newrank.cn/study/detail/F6C6199D985B1A29

相关推荐

联系我们

邮箱：contact@newrank.cn

地址：四川省成都市武侯区大合仓星商界4栋2单元802

关注服务号

产品功能

测声量实时复盘声量、SOV和搜索指数听声音洞察品牌、用户、和竞争对手管声誉预警负面舆情，加强正面推广

使用案例

品牌分析口碑营销声誉管理竞品对比市场研究洞察用户需求

· 高新技术企业 · 全国内容科技创新创业大赛第一名 · 上海文化企业十佳 · 复旦大学新闻学院提供全方位学术支持