关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4264人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

游客境外租车加错油"全额保险"被判失效 还被扣6000元

封面新闻 浏览 16780

为什么山系火锅不排队了?

互联网那些事 浏览 3522

被章若楠、秦岚带火的鞋子竟然是它?春天这样穿又美又气质!

LinkFashion 浏览 2865

蒋欣节目中直言自己没人追,理想型竟然是他!

青史楼兰 浏览 4157

明年上市 金标大众首款轿车 与众07申报信息发布

网易汽车 浏览 4625

小米REDMI Turbo 5 Max手机“续航耐力赛”直播战报出炉

IT之家 浏览 3428

格陵兰岛称选择丹麦和欧盟 已准备好迎接更大规模军事存在

国际在线 浏览 3313

AI驱动产业升级 全屋智能迈入生态竞争新阶段

封面新闻 浏览 2636

商务部:2026年优化消费品以旧换新政策实施

央视财经 浏览 3417

具俊晔亲手揭幕,大S雕像真容曝光,S妈拥抱雕像哭泣

素素娱乐 浏览 3344

什么?!你告诉我佘诗曼已经50岁了

时尚COSMO 浏览 4091

CounterPoint称2025Q4印度手机市场联发科斩获48%份额

IT之家 浏览 2525

中国新能源汽车渗透率58.37%创历史新高

大象新闻 浏览 4528

陈道明主演!36集谍战剧来袭,是《沉默的荣耀》后我唯一想追的剧

娱乐圈笔娱君 浏览 4531

美否决全球最大光伏电站之一 特朗普曾称全球变暖是骗局

澎湃新闻 浏览 4613

连续被血洗!今年前十个月的涨幅,币圈一个月跌完了

华尔街见闻官方 浏览 4232

五六十岁女性别瞎穿,教你三步解锁优雅气质,轻松告别油腻感

静儿时尚达人 浏览 4460

上年纪的女人买“裤子”,不妨按照这3个原则试试,显瘦时髦

静儿时尚达人 浏览 4640

关键邦选举印人党"罕见胜利" 莫迪重掌政治主动

环球网资讯 浏览 16034

保时捷纯电卡宴即将首发,PPE平台打造

车评网 浏览 3408

最高补贴1.5万元!深蓝、小米、蔚来等车企“兜底”新能源车购置税差额

红星资本局 浏览 4415
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1