关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3451人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 3326

哈马斯称以色列未履行停火协议 呼吁美方施压

国际在线 浏览 3691

内塔尼亚胡:以色列将不得不做出"痛苦且重大"让步

环球网资讯 浏览 6559

今年流行“洋葱式”穿法,这样穿高级又好看!

LinkFashion 浏览 3722

23岁硕士徒步因高反去世 刚出现症状时没有听劝下撤

红星新闻 浏览 9207

世卫组织发话:美国有权退出 2.6亿美元欠费必须交上

极目新闻 浏览 7390

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 3680

德容:梅西曾是我的偶像,对我来说他是史上最佳

懂球帝 浏览 4473

我们为什么需要节日穿搭?

时尚COSMO 浏览 2831

OptiScaler发测试版:抢跑AMD为Vulkan游戏开启FSR 4

IT之家 浏览 2929

对话工程院院士王浩:我国独创的“河湖长制”值得向“全球南方”国家推广

封面新闻 浏览 4303

OpenAI完成重组!微软持股缩减至27%,市值再超4万亿美元

澎湃新闻 浏览 4217

蔚来乐道发布换电站电池翻倍计划

电动知家 浏览 3853

白山云霍涛:智能体时代,信任是比体验更高的「生死壁垒」

节点财经 浏览 3406

拯救“衰老”,这么护肤才有效率!

时尚COSMO 浏览 2862

中国科技股深夜爆发,腾讯飙升9%,首批“政务龙虾”已上线

21世纪经济报道 浏览 2616

已减重10公斤的泫雅澳门演出晕倒后公开致歉

封面新闻 浏览 4273

特朗普连绵不绝的骚操作高到了大气层!

宋鸿兵 浏览 4333

鲁媒谈准入:新赛季会带给更多球队机遇,想获红利需守住阵地

懂球帝 浏览 3779

美国禁令反噬!中国断供培育钻石,半导体巨头:完了,要停产!

木禾投研 浏览 4539

阿迪达斯是雪中飞生产,可你买的雪中飞不一定是雪中飞生产的

红星资本局 浏览 4422
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1