关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3505人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中俄关系为何不结盟?结伴不结盟好处更多

浏览 8269

文淇签约陈坤周迅舒淇公司,成为张婧仪同事

师维 浏览 3198

SpaceX称识别并切断缅甸电诈园区周边逾2500台“星链”设备

澎湃新闻 浏览 4366

嘉定企业携新品亮相集成电路设计业展览会

上观新闻 浏览 3223

诺丁汉森林公布扩建主场计划,将把主场扩建到52000座

懂球帝 浏览 3751

7场贡献3球1助攻,麦肯尼当选尤文1月最佳球员

懂球帝 浏览 3292

开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!

雷峰网 浏览 3184

杨瀚森明日再战G联赛!开拓者官宣两大活动:送玻璃杯+售马年球衣

罗说NBA 浏览 2898

博纳老板于冬被澳门赌场追债400多万

严肃八卦 浏览 2582

或为增程形式 上汽大众ID.ERA轿车谍照曝光

车质网 浏览 1641

邓丽君逝世31周年纪念日,三哥邓长富墓地献花:我从未忘记妹妹

素素娱乐 浏览 1230

韩鹏:很高兴能战胜争冠球队,全体球员的发挥都非常出色

懂球帝 浏览 4417

看了隆妮表演才知道,观众都冤枉杨幂了?

霁月文娱阁 浏览 4628

无人驾驶获《时代》2025最佳发明奖:萝卜快跑、谷歌、特斯拉全球竞速

上观新闻 浏览 4638

AI发展日新月异如何跟上变化?徐汇工匠学院人工智能训练师课程助你一臂之力

上观新闻 浏览 3452

媒体:伊各方誓言赢得战争 美国现在即使想退出也很难

环球网资讯 浏览 34216

止步“五连涨”!美股12月“开门黑”

中新经纬 浏览 3903

特朗普:伊朗知道该做什么 也知道不该做什么

齐鲁壹点 浏览 15572

为异种器官移植提供强有力“猪队友” 上海SPF猪赋能国家科技重大专项

上观新闻 浏览 3288

账面资金高达43亿,却要募集13亿,这家老牌企业差不差钱?

IPO日报 浏览 4511

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 18935
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1