关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2143人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

足协官宣 45岁邵佳一出任国足新主帅

央视新闻客户端 浏览 15420

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 8227

法兰克福左后卫布朗:我们依靠整体防守萨拉赫,而不是我单防

懂球帝 浏览 3301

特朗普上台后,美国的“狗腿子”要小心了!

浏览 26359

《新闻女王2》首播爆开!开局高能剧情紧凑,黄宗泽演技拖后腿

萌神木木 浏览 3092

国家放大招了,一口气画了10个圈!

米筐投资 浏览 3424

伊沃比:梅努你把我的手“搞废”了,这家伙力气真大

懂球帝 浏览 2030

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家 浏览 1957

太二不做酸菜鱼了?告别酸菜鱼的太二想干啥?

江瀚视野 浏览 2288

新华保险首个中资产康养旅居社区落地开启旅居养老新范式

经理人杂志 浏览 3210

E句话| 爱马仕继承人被曝坐廉航,150亿美元下落不明?

仙女事件簿 浏览 2183

柬埔寨拒引渡3名韩国籍"杀猪盘"头目回韩国:就地审判

红星新闻 浏览 8664

成为新公路之王!极氪8X预售37.68万元起

网易汽车 浏览 1341

山东城商行“王者之战”戏剧性落幕

财经众议院 浏览 1642

美国进逼委内瑞拉 分析人士:已突破国际法的危险界限

上观新闻 浏览 3175

从素人到涨粉30万,她全靠这些穿搭“小心思”?

黎贝卡的异想世界 浏览 1466

活塞112-105复仇绿军迎4连胜,坎宁安32+10,布朗空砍34分

懂球帝 浏览 2588

4年时间门店从0增至960家,全国开店的零食品牌,如今陷入闭店争议!官方回应:主动放缓是策略,不是叫停加盟

每日经济新闻 浏览 2507

全网泪目!《马踏樱花》一夜刷屏

手工制作阿歼 浏览 2818

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者 浏览 3159

又赢了!19岁国乒黑马绝杀日本后势不可挡 高情商发言存大将之风

颜小白的篮球梦 浏览 2929
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1