关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2191人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今日热点:迪士尼OpenAI合作;JENNIE和DEX将出演新综艺……

伊周潮流 浏览 2582

优质智能体验/1.5T增程 别克至境L7正式亮相

网易汽车 浏览 4255

出海容易融入难:中国品牌出海的公关挑战与破局

金角财经 浏览 2210

月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则

IT之家 浏览 2376

西班牙足协主席:我们会充分照顾球员利益,俱乐部可以放心

懂球帝 浏览 3225

继弯刀裤,阔腿裤之后,“围裹式长裤”突然大火!

LinkFashion 浏览 341

61岁朱军近况曝光!扎根甘肃成治沙“老把式”

代军哥哥谈娱乐 浏览 2418

17年的双十一底层逻辑变了?“小时达”来了,AI帮你选品

时代周报 浏览 3101

拉夫罗夫被指"地位下降" 克宫否认其与普京关系紧张

红星新闻 浏览 8348

泽连斯基签署多项针对俄罗斯制裁令

国际在线 浏览 3414

伊朗"蚊子舰队"披露:被美方视为霍尔木兹海峡的主要威胁

扬子晚报 浏览 294

小米成都车祸引解锁争议 打不开的电动车门成监管焦点

界面新闻 浏览 7716

美媒:大批美军机突然飞往欧洲

环球时报国际 浏览 2323

止步“五连涨”!美股12月“开门黑”

中新经纬 浏览 2765

新国标来了!曾经吹上天的辅助驾驶要“变天”了

知嘹汽车 浏览 277

杨家玉夺全运第2金!马拉松竞走混合接力:北京一队刷PB夺冠

全景体育V 浏览 3170

从“养儿防老”到攒私房钱,农村老人的想法变了

观察者网 浏览 1751

张朝阳缅怀杨振宁:他是大神 在物理学家中排第一

极目新闻 浏览 7098

林俊杰跟七七又被偶遇了!贴心帮女友提包,曝女方父亲是经济犯

萌神木木 浏览 2284

古二录音被忽略的细节!秦雯闺蜜歧视妇女,业内编剧还在嫌弃观众

萌神木木 浏览 3055

融资1111亿元,估值近8750亿元,全球最贵自动驾驶独角兽诞生

红星资本局 浏览 2061
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1