for 知乎链接图标抓取
阿里通义首个音频生成模型ThinkSound正式开源
2025-07-06 19:25:00
情报
行业动态

新榜讯 7月5日讯,阿里“通义大模型”公众号发布消息,通义实验室首个音频生成模型ThinkSound正式开源,此举将突破“静音画面”所带来的想象力限制。ThinkSound开创性地将CoT应用于音频生成领域,促使AI能够逐步明晰画面事件与声音之间的关联,进而达成高保真、强同步的空间音频生成效果。这并非简单的“看图配音”,而是真正意义上的“听懂画面”。


热门文章
热门标签
相关推荐
联系我们
邮箱:contact@newrank.cn
地址:四川省成都市武侯区大合仓星商界4栋2单元802
声量通服务号
关注服务号
newrank
· 高新技术企业 · 全国内容科技创新创业大赛第一名 · 上海文化企业十佳 · 复旦大学新闻学院提供全方位学术支持
©2021 NEWRANK