关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2182人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

零百2.5s 保时捷纯电Cayenne北京车展首发

车质网 浏览 2083

新势力洗牌激烈:零跑、华为双雄争霸 方程豹斗败“蔚小理”

道哥说车 浏览 2813

"民营船王"33亿元入主杉杉 继母长子内斗2年双双出局

都市快报橙柿互动 浏览 3479

纯电续航超400km ID.ERA 9X将于4月正式上市

车质网 浏览 2066

黄仁勋放大招,全栈 AI 加持的NVIDIA 要承包智驾未来?

汽车观察AUTO 浏览 2239

「死亡互联网理论」刷屏硅谷!Reddit创始人预警,奥特曼公开发声

新智元 浏览 3336

成为新公路之王!极氪8X预售37.68万元起

网易汽车 浏览 1335

今天起,一场关乎14亿人的命运转折来了!

米筐投资 浏览 3206

媒体披露:U23国足主帅禁止球员在驻地点外卖

环球网资讯 浏览 19543

优衣库在华跑偏

北京商报 浏览 3526

微信不敢加的功能,腾讯把它塞进了这个新App里。

差评XPIN 浏览 2205

10月车企交付数据汇总:小米小鹏均超4万,零跑破7万

三言科技 浏览 3100

比亚迪、奇瑞出口北美迎来转机!!!

极速车情speed 浏览 2231

2026北京两会|对话市政协委员刘亮:机器人技术迭代提速,北京打通产学研转化链路

北京商报 浏览 2102

15万预算“抄底”自主SUV 这几款车型闭眼入

独家引擎 浏览 2425

邮报:法布雷加斯和特里不在切尔西新帅候选名单上

懂球帝 浏览 2408

为财政刺激计划融资,日本拟增发逾11.5万亿日元新债

华尔街见闻官方 浏览 2886

特朗普称将会见泽连斯基 讨论防空与远程导弹援助等

新京报 浏览 2817

有多想不开才去巴西投资?

虎嗅APP 浏览 2411

拉门斯:阿莫林把压力放在自己身上,他为我们承担了很多压力

懂球帝 浏览 3430

当“蔚小理”跌出头部:2026车企淘汰赛全面加速

首席商业评论 浏览 2456
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1