关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3118人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鲁媒:山东队将与宁波队、海牛与申花进行热身赛

懂球帝 浏览 1654

特朗普称可能将军事行动扩大到墨西哥和哥伦比亚

大象新闻 浏览 2725

摩托罗拉Edge 70 Ultra现身Geekbench,处理器或有新情况

IT之家 浏览 3022

美军火商称俄乌冲突及巴以冲突推动利润增长

环球网资讯 浏览 3353

官方:巴黎前锋杜埃右大腿肌肉拉伤,将伤缺数周

懂球帝 浏览 3209

医药新股闹涨“A+H市场”

北京商报 浏览 2688

香港65公斤黄金被劫价值超半亿 西九龙重案组深夜通报

极目新闻 浏览 15816

OpenAI 呼吁美国政府将芯片法案的税收抵免扩大至 AI 数据中心

IT之家 浏览 3124

特朗普政府要求美国最高法院准许将美联储理事库克免职

华尔街见闻官方 浏览 4063

拉姆塞:我的合同被美洲狮终止了,这令我感到意外且失望

懂球帝 浏览 2562

法兰克福3-4柏林联合,伯克戴帽,伯卡特点射,瓦希送助攻

懂球帝 浏览 4061

男子自带3瓶茅台被服务员调包 摸酒瓶辨温度识破伎俩

封面新闻 浏览 7832

成功冲乙,厦门壹零贰陆主帅:厦门是一座有足球底蕴的城市

懂球帝 浏览 3465

国家出手规范汽车价格!买车将更透明?

优视汽车 浏览 2587

谢锋:中国大蒜做梦也没想到会被美列为"国家安全威胁"

中国驻美国大使馆 浏览 33556

千万粉丝网红"猴哥说车"官宣离婚:缘分尽了 和平离婚

扬子晚报 浏览 18881

自动驾驶行业变天了!英伟达下场,要做“Robotaxi的安卓”?

雷科技 浏览 3250

女子被判向出轨丈夫公开道歉15天 道歉视频引万人围观

大风新闻 浏览 12998

五六十岁“穿衣见品味”!这4个搭配小技巧,比同龄人显气质

静儿时尚达人 浏览 5321

上年纪的女人穿衣别焦虑,试试这几个搭配套路,优雅还减龄

静儿时尚达人 浏览 3152

冯仑:兄弟管公司,女朋友管章子,「江湖人」的企业往往都死得快

冯仑风马牛 浏览 3311
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1