关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3261人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 4420

美国政府联手苹果、微软、OpenAI等公司,招募1000名工程师打造"科技力量"

华尔街见闻官方 浏览 3748

印尼国脚小赖因德斯:这段旅程始于梦想,如今却以痛苦告终

懂球帝 浏览 4653

未成年女性称被爱泼斯坦当"孵化器" 还遭公司高管强奸

红星新闻 浏览 100767

博主:王子铭今天自行加练,周金辉、李明等高层现身训练基地

懂球帝 浏览 4254

5人违规穿越鳌太线3人遇难:为规避罚款手机调飞行模式

极目新闻 浏览 8348

萧敬腾在岳父追思会上拥抱妻子,含泪致辞

素素娱乐 浏览 3055

米体:尤文自2019年起已完成四次增资,总额接近10亿欧

懂球帝 浏览 4097

进行大量体能训练恢复,博格巴:我好像签约了马拉松俱乐部

懂球帝 浏览 5051

吹过的牛,奇瑞新能源兑现了

电动势 浏览 3239

ESPN:若卡塞米罗接受大幅降薪,曼联不排除留下他

懂球帝 浏览 4465

日产全新中大型SUV曝光!配激光雷达+800V平台,增程/纯电双动力

小史谈车 浏览 3887

权力重构?泽连斯基亲信部队高层遭反腐

浏览 7310

梦想100万亿美元,追觅CEO却忙着网络通缉

金角财经 浏览 3235

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者 浏览 4265

消失5个月后泰禾黄其森“归来”

地产深度报道 浏览 3505

大礼包?蓉城海港送对手亚冠首胜!上海双雄成唯二0胜队+包揽倒2

我爱英超 浏览 4554

又见借媒体之手维权,事后要求删稿…

深蓝财经 浏览 3370

美媒:特朗普已听取关于军事打击伊朗方案的汇报

新华社 浏览 3423

大盘五连涨!今年3次五连涨后发生了什么?

每日经济新闻 浏览 3707

迪士尼,10亿美元投资OpenAI

中国基金报 浏览 3856
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1