关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3277人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

31省份去年人口出生率数据公布:哪些省份生娃多?

第一财经资讯 浏览 4550

莫斯科大学突破:普通照片实现房间结构与物品识别

科技行者 浏览 4537

标杆的智能化进阶 试驾一汽-大众全新速腾L

车质网 浏览 4505

小米、小鹏拿证,多家车企晒L3自动驾驶牌照!司机离解放双手还有多远?

时代周报 浏览 3662

还是这些穿搭适合秋天!衣服多穿一下“基础款”,百搭又舒适

静儿时尚达人 浏览 4568

一加 15 手机现身中国电信终端产品库,10 月 27 日发布

IT之家 浏览 4374

吕焯毅:我们踢得很团结有韧劲,大家都满意这场比赛

懂球帝 浏览 4354

HMD Pulse 2 Pro手机跑分曝光:紫光展锐T7250芯片、4GB内存

IT之家 浏览 3908

对话郝飞:智能座舱新物种 斑马为端芯片带来的新机遇

网易汽车 浏览 4656

华为鸿蒙智行下半场的战略之变

汽车K线 浏览 4878

优雅,与皱纹无关

Yuki女人故事 浏览 2405

东北大妈140亿“黑金”豪门,彻底覆灭了

大猫财经Pro 浏览 3387

哈梅内伊遇袭身亡 被指已指定暂代最高领袖责任人选

新民周刊 浏览 40774

华为广汽新车明年6月上!任正非建议品牌名,徐直军参与造型评审

车东西 浏览 3871

释永信老照片流出 21岁的他推师傅看病看起来老实本分

火山詩话 浏览 68521

2025秋冬一定要拥有的5只包包,怎么搭都好看

LinkFashion 浏览 6406

比亚迪唐9系旗舰SUV测试 要从BBA嘴里"抢肉吃"?

车矩阵更懂车 浏览 3405

倾家荡产120万上星光大道,她如今怎样了

青橘罐头 浏览 4655

伊朗指责美以策划动乱 哈梅内伊呼吁伊朗人民保持团结

环球网资讯 浏览 3465

前男友转身花5亿娶闺蜜,徐梵溪的选择耐人寻味

失宠的小野猪 浏览 3688

国安部:有间谍入住海景民宿偷拍军港 被老板识破

央视新闻客户端 浏览 4677
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1