for 知乎链接图标抓取
中国信通院发起大模型幻觉测试,总体涉及五种测试维度
2025-03-19 16:45:00
情报
行业动态

新榜讯 3月19日讯,据中国信通院消息,中国信息通信研究院人工智能所依托前期的 AI Safety Benchmark 测评工作,启动大模型幻觉测试。此次幻觉测试以大语言模型作为测试对象,涵盖事实性幻觉与忠实性幻觉这两种类型。测试数据囊括 7000 余条中文测试样本,测试形式涵盖对应忠实性幻觉检测的信息抽取与知识推理两类题型,以及针对事实性幻觉检测的事实判别题型。整体涉及人文科学、社会科学、自然科学、应用科学和形式科学这五种测试维度。


热门文章
热门标签
相关推荐
联系我们
邮箱:contact@newrank.cn
地址:四川省成都市武侯区大合仓星商界4栋2单元802
声量通服务号
关注服务号
newrank
· 高新技术企业 · 全国内容科技创新创业大赛第一名 · 上海文化企业十佳 · 复旦大学新闻学院提供全方位学术支持
©2021 NEWRANK