关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2315人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

版博会观察:冰箱贴凭啥成文创顶流?AI+版权如何焕新意?

南方都市报 浏览 3359

有没有人能同时挑战泡泡玛特和卡游?

斑马消费 浏览 2351

纽约州签署《RAISE法案》,推动人工智能安全监管

IT之家 浏览 2627

33岁的张一山惊艳亮相,杨紫这次真得避嫌了?

探长影视解说 浏览 3150

再遭失利,内马尔不满自己被换下并直接返回更衣室

懂球帝 浏览 3061

美防长:战事不会“没完没了”

环球网资讯 浏览 29

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

财联社 浏览 8566

全红婵是否退役悬念揭晓,央视新闻给出权威答复

蒋小成爱钓鱼 浏览 3471

阿莫林自信可率曼联英超夺冠!对比弗爵时代不公平,理解名宿质疑

罗米的曼联博客 浏览 2761

边打字边出片,交互式生成长视频!英伟达联合MIT开源新SOTA

新智元 浏览 3432

媒体:美一系列肆行无忌行径 释放极其危险信号

上观新闻 浏览 6845

AI成核心方向 银行启动博士后招聘

北京商报 浏览 2962

冬奥总结:雪上项目当主角 中国刷新境外参赛最佳

体坛周报 浏览 1715

中东棋局骤变:美以\"师徒反目\"暗流汹涌

浏览 6436

2025蔚来日在杭州成功举办

财经无忌 浏览 4099

全力向上!重庆铜梁龙赛季最后一个主场将展示全场拼图TIFO

懂球帝 浏览 3278

华为登顶,吃了谁的蛋糕?

智东西 浏览 2275

贝弗利:安东尼曾因不想跟林书豪同队而没跟哈登和霍华德组三巨头

懂球帝 浏览 3115

我永远不会买黄金,更不会投资黄金!

浏览 25425

高市内阁名单出炉 身材火辣的日本知名写真女星入选

红星新闻 浏览 9250

媒体:美军或捅破一个巨大的马蜂窝 与俄军在伊朗硬刚

新民周刊 浏览 6628
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1