关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者3259人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

SemiAnalysis深度报告:美国电网跟不上,AI数据中心“自建电厂”跟时间赛跑

华尔街见闻官方 浏览 3578

预售22.99万起!阿维塔06T 2.78秒破百+旅行车大空间

网易汽车 浏览 1917

9场9球,意甲刷新最低进球纪录?

体坛周报 浏览 4399

狼队主帅:斩获首胜之后我们不会松懈;小将马内踢得非常好

懂球帝 浏览 3498

4月21日上市 2026款乐道L90官图发布

车质网 浏览 1757

蚂蚁集团首席执行官韩歆毅:以“数智普惠”惠及每一位老百姓

上游新闻 浏览 4177

美军空袭尼日利亚 至少有4枚"战斧"疑未能引爆

环球网资讯 浏览 3428

丰田新款Land Cruiser FJ最新消息曝光

乐选爱车 浏览 3626

新设计 兰博基尼Manifesto概念车官图发布

车质网 浏览 3729

强硬夺权、父子决裂!84岁“鞋王”何以至此?

无冕财经 浏览 3436

美联储年内“三连降”,2026年利率走向何方?

中新经纬 浏览 3940

李亚鹏海哈金喜离婚早有预兆!女方无意说漏嘴,婚姻不能只有爱情

萌神木木 浏览 4554

美股存储芯片全线爆发,美光科技猛涨10%,闪迪涨超9%,英特尔涨超7%,国际油价突破100美元

21世纪经济报道 浏览 1180

同样是悼念亡妻,把具俊晔和辛柏青放一起比较,差别怎么这么大!

娱乐圈笔娱君 浏览 4394

记者:詹姆斯复出后将湖人的快攻水平从倒数后5提升到正数前5

懂球帝 浏览 4059

李小鹏女儿14岁奥莉近照刷屏!真是女大十八变

今古深日报 浏览 1678

iQOO 15 / Neo11 手机全版本标配 2K 屏,自带 AR 增透消反保护膜

IT之家 浏览 4535

“杭州湾揽胜”杀到!极氪8X的差异化优势是啥?卖这个价必火

蜗牛车志V 浏览 3510

限制赎回风波后,当红PE Blue Owl为数据中心专项基金募资17亿美元

华尔街见闻官方 浏览 3989

茸城她故事丨毋冬梅:以柔肩担重任,用匠心筑梦浩瀚星河

上观新闻 浏览 2795

NBA战报:凯尔特人115-101公牛取NBA4连胜,安芬尼-西蒙斯27+3+3

懂球帝 浏览 3434
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1