关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3449人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

三星被曝2026年发新款折叠屏手机,屏幕超7英寸、护照式设计,叫板苹果

智东西 浏览 3807

凌晨4点利物浦保卫战!输球=英超5连败+72年之耻 标王缺席

叶青足球世界 浏览 4274

KAIST团队突破视频生成瓶颈:让AI学会"自我反思"修正动作错误

科技行者 浏览 3370

哈登终于不用背锅!快船遭雷霆逆转吞5连败 小卡三节22+8被迫打卡

颜小白的篮球梦 浏览 3708

AI数据中心太火,美商务部长被盯上了,民主党议员发函敦促调查利益冲突

华尔街见闻官方 浏览 3718

包钢板材厂爆炸工人被气浪掀飞 一铁球飞射砸塌二层楼

上游新闻 浏览 7980

护肤新趋势!从“表面功夫”到“内调外养”的转变

时尚COSMO 浏览 2787

古二录音被忽略的细节!秦雯闺蜜歧视妇女,业内编剧还在嫌弃观众

萌神木木 浏览 4196

债市,大调整!

米筐投资 浏览 3916

18.51亿元!这家信托100%股权,第三次挂牌!

券商中国 浏览 3466

本赛季前5轮三支英超升班马共拿19分,比上赛季三队快一倍

直播吧 浏览 5228

哈马斯代表团:与以色列间接谈判取得积极进展

国际在线 浏览 3831

NASA阿耳忒弥斯3号SLS火箭芯级启运,为明年发射铺路

IT之家 浏览 1728

美伊冲突两个月尘埃未定 伊朗或仍保留约70%导弹库存

看看新闻Knews 浏览 32536

羊绒专场 || 被大家问了无数次的经典款,终于回来了!

黎贝卡的异想世界 浏览 3969

职场“关系户”还值得羡慕吗?

识局 浏览 4522

无止境,梅西常规赛28场贡献29球16助攻

懂球帝 浏览 4470

短剧版《小巷人家》,为什么难成下一部《父母爱情》?

仙女事件簿 浏览 3806

日本知名巨头退出中国内地市场 有门店日排队3000桌

21世纪经济报道 浏览 8622

外卖小哥蹊跷失踪22天:凌晨独自到水库 现场找到电动车

极目新闻 浏览 4566

上午设计、次日量产,“AI密度最高的城市”如何借供应链优势加快企业出海?

时代周报 浏览 4264
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1