关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2140人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 2758

深圳松岗街道:以“开放性场景”创享技术可感、产品可触、产业互联“新模式”

中国商报 浏览 2404

特朗普"力挺"中国 高市闯祸能否拥有核武日本说了不算

空天力量 浏览 40440

德媒:德总理拟动用俄央行在德冻结资产援乌

新华社 浏览 2646

新加坡主权基金起诉蔚来,股价迎中、美、新“三国杀”!

野马财经 浏览 3351

让AI沉下来 北京锻造人工智能第一城

北京商报 浏览 2101

陈天桥亲自下场押注脑机接口赛道,中国首家超声波BCI企业格式塔成立

华夏时报 浏览 2429

AI信任危机加剧:Sora视频“以假乱真”,国内灰产3元“洗白”水印

蓝鲸新闻 浏览 3487

媒体:中美元首会晤让赖清德坐立不宁、寝食难安

环球时报新闻 浏览 14099

大型断舍离后,这4类东西我不会轻易再买

黎贝卡的异想世界 浏览 3447

阿拉维斯vs西班牙人:德尼斯-苏亚雷斯、阿莱尼亚首发,鲁文-桑切斯、基克-加西亚出战

懂球帝 浏览 3137

Meta一边挥刀赶走老白兔,一边改绩效发甜枣

字母榜 浏览 2262

国乒第一女神芦璐:嫁给刘国正

李橑在北漂 浏览 1980

海尔集团与蚂蚁集团签署全面战略合作协议 聚焦数字支付与医疗健康

财闻 浏览 3463

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

新智元 浏览 3422

看了这些日系穿搭才知道,还是西装和衬衫最靠谱,舒适大方

静儿时尚达人 浏览 3187

NVIDIA牢牢把握独显市场92%份额!Intel终于突破1%

快科技 浏览 2798

TA:温格擅长从宏观层面谈论足球,他不适合参与修改足球规则

懂球帝 浏览 2225

小萨博尼斯适合勇士吗? 三大缺点阻碍他加盟

仰卧撑FTUer 浏览 2579

宁波网友投诉到理发店理发被诱导消费:1次花了6万元

潇湘晨报 浏览 7507

日均排队超千桌!“反预制”的年轻人捧红了地方菜

餐饮老板内参 浏览 2873
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1