关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3504人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

沃勒尔:德国队首发门将仍存在变数,特狮必须稳定上场才行

懂球帝 浏览 3759

慢镜头:米兰、尤文和三家英超俱乐部对热苏斯感兴趣

懂球帝 浏览 4382

《逍遥》最大谜团:村民献祭妹妹给树妖,为何秉烛只恨妖不恨人?

肆季娱乐 浏览 3566

拜仁欧冠战巴黎大名单:凯恩领衔,诺伊尔、卡尔在列

懂球帝 浏览 4407

明明家世显赫,却凭实力成为世界冠军

梁蜱爱玩车 浏览 4438

欧文:拜仁现在肯定懊悔不已,赫拉芬贝赫身价绝对超过1亿镑

直播吧 浏览 5138

新质生产力“可感可及”,华强北机器人展演月“硬核度”爆表

南方都市报 浏览 5067

纯电续航325km 小鹏P7+增程版申报信息曝光

车质网 浏览 4346

马德里康普顿斯大学VERSE:AI实现文档视觉信息深度理解

科技行者 浏览 3464

五月天演唱会风波升级!票卖不完就取消

萌神木木 浏览 2666

年底交付 兰博基尼Temerario即将国内上市

车质网 浏览 3197

中方回应是否放松稀土出口管制

财联社 浏览 13755

罗永浩质疑大金中央空调;摩尔线程首款AI电脑发布丨邦早报

创业邦 浏览 3776

俄称击退乌军解围行动 乌称击退俄军进攻

国际在线 浏览 4065

巩俐的前夫是圈外高级打工人,75岁在新加坡养老

白面书誏 浏览 4421

早春绝美cp:九分裤+运动鞋

Yuki女人故事 浏览 3335

诺和诺德再现高层震荡!董事长等7名高管将集体离职,近一年市值蒸发超千亿美元

时代周报 浏览 4389

年薪300万请来LV高管!泡泡玛特“奢侈品化”的生死赌局

杠杆游戏 浏览 3932

iPhone 17 Pro被黄牛拒收:卖的人多,货太多了

大象新闻 浏览 5081

降价30万,不是宝马仁慈了,而是被逼没办法

正在说车 浏览 3509

基准新规划定过渡期!近75%基金“及格线”或需调整

券商中国 浏览 4264
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1