爆点资讯

这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究，发表于2025年1月，论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来，一个令人困惑的现象开始引起科学家们的注意：那些只用文字训练的大型语言模型，竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人，仅仅通过阅读绘画理论书籍，就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密？

Meta的研究团队决定深入探究这个谜题。他们发现，当我们给这些"纯文字出身"的AI模型配上视觉编码器，然后进行少量的多模态训练后，它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是，有些模型甚至在从未"见过"图像的情况下，就能完成某些视觉推理任务。

为了彻底理解这种现象，研究团队设计了一套系统性的实验方案。他们像调配食谱一样，精心调配不同类型的文本数据，训练了超过100个不同规模的模型，消耗了50万GPU小时的计算资源。这项研究的规模之大，就像是在建造一个巨大的实验工厂，专门用来生产各种"口味"的AI模型。

Meta团队揭秘大模型＂视觉天赋＂之谜：文本训练竟能培养看图能力

抖音发布20...

再次掀翻AI...

Nature...

中年女人的开...

时尚守艺人 ...

业主2000...

人类会彻底沦为无用阶级吗？

中国海警舰艇编队在钓鱼岛巡航

全红婵夺金新搭档身份不简单赛后发文信息量大

梁小龙一生刚直！因一句“我是中国人”被逼写悔过书，他当场拒写

后瑞幸时代，挪瓦咖啡凭什么冲击行业第二？

39集《沉默的荣耀》大结局前瞻，5人再无反转，黎晴成唯一变数

弗里克：相信阿隆索会有新工作；坎塞洛明天有可能上

武汉女子遭遇APP投资骗局：起诉被驳回警方又不立案

时尚守艺人 | 以木为纸，雕出万千世界

土拍市场延续“缩量提质”百强房企今年前两月拿地超950亿元

穿来穿去还是羽绒服最靠谱！配裤子裙子都合适，舒适自然保暖

印欧达成自由贸易协定

权力重构？泽连斯基亲信部队高层遭反腐

这俩人原来是夫妻，因拍《红楼梦》结缘

曾以105.6万成交的＂凶宅＂再次上架 26.6万元起拍

预售权益价10.69万元起东风日产N6将上市

女子代购海外＂不老药＂疑遭职业打假人起诉＂退一赔十＂

环球：中国实施稀土出口管制美方没必要过度反应

女子乘二等座买到＂单人座＂：空间较宽敞旁边能放行李

firefly萤火虫第4万辆交付售11.98万元起

大动作调仓！机构开年疯狂扫货这些板块，而火爆的芯片、半导体ETF竟被抛售

动力系统升级新款方程豹豹5谍照曝光

续火花：不间断的敷衍，就是真诚

女人会不会打扮很重要！配色不老气、穿衣不拖沓，耐看又大方