关闭广告

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者3105人阅读


你有没有试过这样的体验:跟朋友聊天时,你想让他看看照片里的某个东西,但又不知道怎么准确描述它的位置?你可能会说"就是那个红色的杯子",朋友却问"哪个红色杯子?"这种沟通障碍在人工智能领域同样存在,而且更加复杂。

由南洋理工大学、腾讯微信视觉团队、新加坡科技研究局等多家知名机构组成的国际研究团队,最近在这个问题上取得了重要突破。他们的研究成果发表在了计算机视觉领域的顶级学术平台上,论文题目是"PATCH-AS-DECODABLE-TOKEN: TOWARDS UNIFIED MULTI-MODAL VISION TASKS IN MLLMS"(arXiv:2510.01954v1),感兴趣的读者可以通过这个编号查阅完整论文。

这项研究解决的核心问题可以用一个简单场景来理解:当你问AI"这张照片里有什么?"时,传统AI只能告诉你"有一只猫、一个杯子、一张桌子",但它无法像人一样直接"指出"这些东西的具体位置。更糟糕的是,当你要求AI找到"桌子上那个蓝色杯子"时,它往往会给出一串看起来很专业但实际上并不准确的数字坐标,比如"[245, 156, 378, 298]",普通人根本无法理解这些数字代表什么。

<
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025年“演技最好女演员”排名,第1实至名归海

皮皮电影 浏览 2671

和宋祖儿恋情谣言澄清后,刘宇宁口碑意外反转

喜欢历史的阿繁 浏览 34

剧版《西虹市首富》首波口碑出炉了!观众打分评价都“一针见血”

娱乐圈笔娱君 浏览 2049

今年冬天流行的“倒三角”穿法,时髦又高级!

LinkFashion 浏览 2415

太猛了!保险巨头炒股竟大赚300多亿

财通社 浏览 3405

内娱白月光,毁于潜规则?

阿淫记录生活日常 浏览 3383

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 3350

大S离去一周年:爱她的人仍在经历一场漫长的告别

仙女事件簿 浏览 2060

东风日产N6最新申报图曝光:选装轮圈与红色卡钳

网易汽车 浏览 3455

硅谷高管消息群一夜未停 H-1B新规让美企慌了白宫找补

红星新闻 浏览 26095

马斯克宣布脑机接口将量产,特斯拉自动驾驶挑战引发安全质疑

红星新闻 浏览 2539

固态电池瓶颈技术取得重大突破!

电动知家 浏览 4060

《玉茗茶骨》张慧雯啊,是最可惜的谋女郎

温柔娱公子 浏览 2302

奚梦瑶何猷君解绑6年婚姻她终于支棱起来了?

如安青何 浏览 3209

主销售价45万起,极氪8X路试谍照曝光

网易汽车 浏览 2806

她是钟小姐的穿搭榜样,从20岁到70岁,每一套都让人想copy

黎贝卡的异想世界 浏览 3265

熊园:“十五五”大方向已定,如何跟踪?

首席经济学家论坛 浏览 3321

特拉维夫多处建筑遭袭 相关区域实施严格管制

环球网资讯 浏览 1522

邮报:纽卡中卫丹-伯恩遭遇肺穿孔和肋骨骨折,将缺阵六周

懂球帝 浏览 2629

乔治亚理工学院联手微软:让AI训练效率暴增21%的神奇新方法

科技行者 浏览 3041

郑钦文晒照新教练技改,外媒称其剑指法网阳光双赛成绩是合作关键

网球之家 浏览 1582
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1