关闭广告

蒙特利尔大学团队发现让AI"分段思考"的惊人秘密

科技行者3085人阅读


这项由蒙特利尔大学Mila实验室的Milad Aghajohari、Kamran Chitsaz、Amirhossein Kazemnejad等研究人员与微软研究院、麦吉尔大学、ServiceNow研究部门合作完成的研究,发表于2025年的arXiv预印本平台(论文编号:arXiv:2510.06557v1)。有兴趣深入了解的读者可以通过该编号查询完整论文,也可以访问研究团队公开的代码仓库和模型权重。

你有没有想过,当我们思考一个复杂问题时,大脑是怎么工作的?比如解一道数学题,我们不会把所有信息都塞在脑海里,而是会分步骤推理,把重要的中间结果记下来,然后基于这些关键信息继续思考。然而,目前最先进的AI模型在"思考"时却不是这样的——它们就像一个强迫症患者,必须把之前想过的每一个字都牢牢记住,这让它们在处理复杂问题时变得极其耗费计算资源。

研究团队发现了一个令人震惊的现象:让一个小巧的1.5B参数模型采用"分段思考"的方式,竟然能在数学竞赛题目上击败那些使用传统"长篇大论思考"方式的大型模型,而且计算成本只有后者的四分之一。这就好比一个聪明的学生用简洁的草稿纸就能解出难题,而另一个学生却需要写满厚厚的笔记本才能

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

印尼总统:已准备好向加沙派遣维和部队

环球时报国际 浏览 3928

巴总理称"将7架印战机炸成残骸" 印方激烈反驳

澎湃新闻 浏览 5027

纳瓦斯:得知转会曼联失败我十分冷静,这激励了我的皇马生涯

懂球帝 浏览 1567

何小鹏的“回旋镖”与超级增程的“阳谋”

1号车盟 浏览 2664

浙商银行前三季度经营稳健,总营收489.31亿元

证券市场周刊 浏览 3243

"商务部公告附件首次改为wps格式"不实 至少5年前已用

极目新闻 浏览 7628

燕翔:A股上市公司增减持特征与近况

首席经济学家论坛 浏览 3302

《小城大事》大结局:李秋萍和杜涛的缘,在月海续写上且圆满

肆季娱乐 浏览 2304

181亿医疗信息化龙头掌舵人周炜,行贿一审被判后辞去董事长

雷达财经 浏览 3169

国债被"抛售"债市遭暴击 日本或在未来面临金融风暴

红星新闻 浏览 35018

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 3274

外资公募绩优产品持仓曝光!

券商中国 浏览 3252

智驾下一个关键挑战,是不被别人摘“桃子”?

虎嗅APP 浏览 2390

马克龙不加入和平委员会 特朗普:加征关税他就会加入

界面新闻 浏览 11617

被拐25年的解清帅大婚 婚礼现场有主播直播带货

半岛官网 浏览 3425

泽连斯基:乌美就领土问题讨论长达6.5小时

每日经济新闻 浏览 16055

地点未定 摩擦又起 美伊核谈判开启前变数频生

极目新闻 浏览 2027

海盗船新键盘内嵌直播控制台,1月29日开卖!

IT之家 浏览 2413

阔腿裤失宠了,今年的“显瘦小黑裤”更时髦百搭!

LinkFashion 浏览 2268

张萌携老公现身演唱会,被拍后导演紧急切屏

泠泠说史 浏览 3949

闹大了!荣梓杉被女友控诉出轨家暴,回应否认,评论区沦陷了

娱乐圈笔娱君 浏览 3288
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1