关闭广告

蒙特利尔大学团队发现让AI"分段思考"的惊人秘密

科技行者661人阅读


这项由蒙特利尔大学Mila实验室的Milad Aghajohari、Kamran Chitsaz、Amirhossein Kazemnejad等研究人员与微软研究院、麦吉尔大学、ServiceNow研究部门合作完成的研究,发表于2025年的arXiv预印本平台(论文编号:arXiv:2510.06557v1)。有兴趣深入了解的读者可以通过该编号查询完整论文,也可以访问研究团队公开的代码仓库和模型权重。

你有没有想过,当我们思考一个复杂问题时,大脑是怎么工作的?比如解一道数学题,我们不会把所有信息都塞在脑海里,而是会分步骤推理,把重要的中间结果记下来,然后基于这些关键信息继续思考。然而,目前最先进的AI模型在"思考"时却不是这样的——它们就像一个强迫症患者,必须把之前想过的每一个字都牢牢记住,这让它们在处理复杂问题时变得极其耗费计算资源。

研究团队发现了一个令人震惊的现象:让一个小巧的1.5B参数模型采用"分段思考"的方式,竟然能在数学竞赛题目上击败那些使用传统"长篇大论思考"方式的大型模型,而且计算成本只有后者的四分之一。这就好比一个聪明的学生用简洁的草稿纸就能解出难题,而另一个学生却需要写满厚厚的笔记本才能

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辛纳重返世界第一无悬念?网友点出阿利西姆难阻意大利人夺冠原因

网球之家 浏览 762

花400元“过家家”,Jellycat火爆看不懂?情绪消费正带来行业新逻辑

红星资本局 浏览 937

央媒痛批辛巴封路,是谁给你这么大权力?

趣看热点 浏览 25865

男子闯红灯被跑车撞飞致数十万车损 交警判定引热议

新闻坊 浏览 94319

尼克-杨:为什么威少场均三双叫刷数据 但约基奇做到却没人批评?

直播吧 浏览 19236

汤森路透正与人工智能公司就内容授权谈判,称立场非常开放

澎湃新闻 浏览 12410

女人过了40岁穿衣别老气横秋,看看这些日系穿搭,得体又显瘦

静儿时尚达人 浏览 672

闪电快讯 | 享界S9T售价30.98万元起 上市24小时大定超过7500辆

电厂 浏览 1709

千亿并购背后,水泥“江湖”风起

网易财经 浏览 26037

年末避险情绪抬升 公募选股遵循涨价硬逻辑

证券时报 浏览 556

法大大黄翔:从他山之石看中国企业数智化升级的机会点

数据猿DataYuan 浏览 10846

前澳总理陆克文在达沃斯论坛上力挺中国经济

金融界 浏览 12771

NBA全明星正赛全场数据:东部飚中42记三分,命中率为43.3%

懂球帝 浏览 12209

科学家发现世界最大蜘蛛网 面积约106平方米

极目新闻 浏览 6039

普里戈任抵达白俄 北约秘书长称已准备好防御威胁

新京报外事儿 浏览 15904

略伦特:也许由于前几天的事,今天我们更有动力

懂球帝 浏览 12402

原足协副主席于洪臣被控受贿2254万余元 法庭择期宣判

直播吧 浏览 12681

春天不能没有小白鞋 时髦经典又百搭!

巧百搭 浏览 19776

132户居民疑喝8年"消防水":洗水箱后放出的全是锈水

新民晚报 浏览 87516

各界人士送别著名计算机科学家汤晓鸥

澎湃新闻 浏览 12774

金九银十冲刺期:中国车企最新销量与目标完成率同步披露

汽车族杂志 浏览 1074
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1