关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3142人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梁小龙一生刚直!因一句“我是中国人”被逼写悔过书,他当场拒写

萌神木木 浏览 2360

后瑞幸时代,挪瓦咖啡凭什么冲击行业第二?

有数DataVision 浏览 2644

39集《沉默的荣耀》大结局前瞻,5人再无反转,黎晴成唯一变数

娱乐圈笔娱君 浏览 3380

弗里克:相信阿隆索会有新工作;坎塞洛明天有可能上

懂球帝 浏览 2310

武汉女子遭遇APP投资骗局:起诉被驳回 警方又不立案

上游新闻 浏览 9126

时尚守艺人 | 以木为纸,雕出万千世界

时尚COSMO 浏览 2522

土拍市场延续“缩量提质”百强房企今年前两月拿地超950亿元

商业观察杂志社 浏览 1639

穿来穿去还是羽绒服最靠谱!配裤子裙子都合适,舒适自然保暖

静儿时尚达人 浏览 2548

印欧达成自由贸易协定

国际金融报 浏览 2106

权力重构?泽连斯基亲信部队高层遭反腐

浏览 6380

这俩人原来是夫妻,因拍《红楼梦》结缘

素衣读史 浏览 2548

曾以105.6万成交的"凶宅"再次上架 26.6万元起拍

封面新闻 浏览 8415

预售权益价10.69万元起 东风日产N6将上市

网易汽车 浏览 2965

女子代购海外"不老药" 疑遭职业打假人起诉"退一赔十"

大风新闻 浏览 4893

环球:中国实施稀土出口管制 美方没必要过度反应

环球网资讯 浏览 6923

女子乘二等座买到"单人座":空间较宽敞 旁边能放行李

极目新闻 浏览 6730

firefly萤火虫第4万辆交付 售11.98万元起

太平洋汽车 浏览 2342

大动作调仓!机构开年疯狂扫货这些板块,而火爆的芯片、半导体ETF竟被抛售

每经牛眼 浏览 2353

动力系统升级 新款方程豹豹5谍照曝光

车质网 浏览 4186

续火花:不间断的敷衍,就是真诚

时尚COSMO 浏览 2740

女人会不会打扮很重要!配色不老气、穿衣不拖沓,耐看又大方

静儿时尚达人 浏览 625
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1