关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者3284人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

离谱!荣梓杉李禹熹聊天记录曝光,女方求荣梓杉报销372元房费

扒虾侃娱 浏览 3783

机械师Mini GTR迷你主机上新:锐龙AI 9 HX 370配置,性能释放70W

IT之家 浏览 4326

闻泰科技百亿半导体资产控制权受限

南方都市报 浏览 4521

33.38亿!刘永好实控的新希望拟定增募资用于数智化升级和还债

红星资本局 浏览 3410

全球第二,欣旺达,再冲固态电池!

飞鲸投研 浏览 4511

伊朗方面披露美军在伊南部海域兵力布防

新京报 浏览 3177

6名中国男子日本滑雪被困获救 救援费为每人100万日元

极目新闻 浏览 7589

小米新手表和手环曝光,REDMI K Pad2小平板电池有望大增

IT之家 浏览 3394

美威胁停买"中国油" 专家:或闹乌龙 为"废弃食用油"

环球时报新闻 浏览 8214

荣耀Magic8 Pro Air手机线下展出,影像、显示等核心参数公开

IT之家 浏览 3457

小马智行第七代 Robotaxi 自动驾驶出租车正式投运,成本下降70%

IT之家 浏览 4267

吴尊元旦晒全家福!一家四口笑容灿烂温馨幸福

失宠的小野猪 浏览 3546

“看好中国新经济!” 渣打集团行政总裁温拓思最新发声

券商中国 浏览 4771

"震荡"之后中美传来好消息 李成钢的表态意味深长

中国新闻周刊 浏览 9754

这一次,54岁的杨钰莹早已经上了另一条大道

青史楼兰 浏览 4178

足球报:J联赛改为跨年赛制,将对降雪地区俱乐部补贴50亿

懂球帝 浏览 4494

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 4327

媒体:郑丽文当选回复大陆贺电 表述难得一见意义重大

经济观察报 浏览 9610

红旗E-QM5换电版车型正式上市 售8.98万元

车质网 浏览 3964

内娱女明星手撕导演,翻车了?

独立鱼 浏览 3391

美国为何长期觊觎委石油 委专家:对美具有互补性

海外网 浏览 3578
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1