关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者4232人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

历史二十大网球瞬间(下):费德勒退役,法网立纳达尔雕像!

网球之家 浏览 2842

恩里克:踢出极高的水平是我们一贯的目标;要避免球员受伤

懂球帝 浏览 4376

博士学历女厅官袭燕被双开:违规收受礼金、消费卡

红星新闻 浏览 8955

资源品价值重估,“新周期”启幕

智谷趋势 浏览 3703

豪华平权大6座SUV 风云T11预售19.99万元起

网易汽车 浏览 4600

国际油价上涨谁会是赢家?外媒:美国石油商“直接受益”,跨国油企希望回归平稳

环球网资讯 浏览 2516

Linux之父Linus配新电脑了!特别要求Intel锐炫B580显卡

快科技 浏览 3933

静默复古风,低调显贵的穿搭密码!得物2025秋冬趋势发布!

LinkFashion 浏览 6498

伊称3天内完成核协议草案 美最大核动力航母进入地中海

环球网资讯 浏览 2815

塞内加尔队26人名单:34岁马内8年后再战世界杯 18岁拜仁天才入选

我爱英超 浏览 514

一文读懂索提诺比率(附索提诺比率选出的牛基--普通股票型)

一地基毛 浏览 4440

中国核聚变技术获国际原子能机构肯定,“环流三号”亮相聚变能国际大会

上观新闻 浏览 4466

外媒:安世半导体已暂停向中国工厂供应晶圆

澎湃新闻 浏览 15182

多家银行关停旗下App,银行App关闭潮意味着什么?

江瀚视野 浏览 4662

售13.98万起 吉利新能源皮卡四驱山地版/高寒版同步上市

网易汽车 浏览 3711

霍家主母显气度:一代卖船供学二代稳大局三代全颜面,四代无人及

不八卦会死星人 浏览 3376

伊姐周日热推:电视剧《大生意人》;电视剧《乌蒙深处》......

伊周潮流 浏览 3317

21岁女生患白血病寻亲 有人主动认亲后表示年份不符

潇湘晨报 浏览 7239

我们为什么需要节日穿搭?

时尚COSMO 浏览 2830

男子犯病救命药滞留酒店前台5个小时后死亡 酒店回应

封面新闻 浏览 16782

2026款丰田皇冠陆放上市 售28.48-33.28万元

车质网 浏览 4082
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1