关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2301人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国人自己的敞篷跑车来了!腾势Z敞篷版曝光

优视汽车 浏览 2742

A股公司老总被抓宣布离婚 80后前妻分9.24亿紧急接班

每日经济新闻 浏览 8325

Agent的发展趋势,CB insights深度剖析了170家公司后给出了答案

DeepTech深科技 浏览 3320

美防长:战事不会“没完没了”

环球网资讯 浏览 28

微软官方确认:Windows 11任务管理器出问题了!

快科技 浏览 3119

彻底清零 缅甸官宣KK园区635栋涉赌诈建筑已全数炸毁

看看新闻Knews 浏览 7162

22岁女医学生遭前男友杀害 临终遗言:我没有对不起你

大风新闻 浏览 12494

欧莱雅中国升级“一代耀一代”科技女生赋能计划

中国新闻周刊 浏览 49

39岁李思思离开央视两年,商演小县城不摆架子

范櫳舍长 浏览 1653

女子把100克黄金当垃圾扔了急哭 查监控发现被人捡走

黄河新闻网吕梁频道 浏览 8667

十分亮眼,阿马德5场非洲杯比赛贡献3球1助,3次获得全场最佳

懂球帝 浏览 2279

柴麒敏:绿色低碳产业将释放约30万亿元新增投资

中国企业家杂志 浏览 2218

日产终于学会“先赢中国市场,再谈全球”

汽车通讯社 浏览 3307

于根伟激励全队:付出最大的努力,把最后4轮比赛“咬”下来

懂球帝 浏览 3516

豆包手机助手宣布将部分调整AI操作能力

中新经纬 浏览 2667

田栩宁恋情风波再升级!疑似若若回应恋情,喊话外界少打听别惹她

萌神木木 浏览 3343

厦门大学等突破AI自学限制:让计算机为自己量身定制学习计划

科技行者 浏览 2076

美众院通过修正案 或禁止美军从中俄购买数字显示器

澎湃新闻 浏览 26145

马斯切拉诺:我对穆勒的记忆并不美好;希望运气在我们这边

懂球帝 浏览 2667

经典与创新的时代对话,保时捷携两款911登陆第八届进博会

观察者网 浏览 3231

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势 浏览 2095
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1