关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2180人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国驻卡塔尔乌代德空军基地部分人员被建议周三晚前离开

环球网资讯 浏览 2298

美军多海域再现“航母真空”

环球网资讯 浏览 2970

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者 浏览 1975

接到立案通知后,股民以为完了,5个月后一算账,7000人账面翻倍

壹只灰鸽子 浏览 2865

将于东京车展首发 全新丰田卡罗拉官图曝光

车质网 浏览 3381

被娱乐圈催熟的林妙可王诗龄!

八星人 浏览 2312

中国队手下败将逆袭进联合杯四强,袁悦45分钟速败引发网友热议

网球之家 浏览 2329

杰哈德指责加沙“和平委员会”组成服务于以方利益

极目新闻 浏览 2274

满电仅需6分钟,宁德时代发布新电池

大象新闻 浏览 314

西蒙尼获第60场欧冠胜利,与克洛普并列主教练胜场榜单第7

懂球帝 浏览 3140

伊朗宣布关闭霍尔木兹海峡

财联社 浏览 284

俄主动向美通报:核动力巡航导弹上天 射程"几乎无限"

上观新闻 浏览 8682

胜利就是最佳礼物,B费:为曼联出战300场最好的庆祝方式

懂球帝 浏览 2701

美团紧急发文

大象新闻 浏览 3201

张嘉译西安别墅庆生,染完头发直接年轻10岁

柒佰娱 浏览 680

邱毅:两岸统一的脚步越来越近

环球网资讯 浏览 2964

没入选巴西国家队,恩德里克在国际比赛日期间前往摩洛哥度假

懂球帝 浏览 3403

技术+临床双向赋能成都脑机接口产业 迎来新机遇

封面新闻 浏览 270

浙江一男子泳池跳水时颈椎严重受伤不治身亡 家属发声

新民晚报 浏览 9023

谁说冬天不能穿裙子?照着搭美出新高度

LinkFashion 浏览 2058

业绩失速,传音控股盯上非洲“电驴”

斑马消费 浏览 2559
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1