for 知乎链接图标抓取
红杉中国推出全新AI基准测试xbench
2025-05-26 16:40:01
情报
行业动态

新榜讯 5 月 26 日,红杉中国重磅宣布推出全新的 AI 基准测试 xbench,同时发布相关论文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。据悉,这是首个由投资机构发起,联合国内外十余家高校以及研究机构的数十位博士研究生共同打造的 AI 基准测试,其采用双轨评估体系与长青评估机制。xbench 不仅能评估并推动 AI 系统能力提升上限及技术边界,还将重点量化 AI 系统在真实场景中的效用价值,并长期追踪 Agent 产品的关键突破。


热门文章
热门标签
相关推荐
联系我们
邮箱:contact@newrank.cn
地址:四川省成都市武侯区大合仓星商界4栋2单元802
声量通服务号
关注服务号
newrank
· 高新技术企业 · 全国内容科技创新创业大赛第一名 · 上海文化企业十佳 · 复旦大学新闻学院提供全方位学术支持
©2021 NEWRANK