关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2309人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新研究让大模型学会主动追问,人机协作效果大幅提升

DeepTech深科技 浏览 2259

"失联风波"过后 画家范曾首度公开露面:近期喜得独子

澎湃新闻 浏览 19512

72岁唐僧迟重瑞卖房,580亿财产成了笑话?

胡一舸南游y 浏览 3155

再现巨额压单!A股跳水,官媒给“题材炒作”降温,商业航天跌停潮

看财经show 浏览 2147

BeingBeyond团队让30种机器人共享一个"大脑"

科技行者 浏览 2081

同济发布全球首部《工程智能白皮书》,发起“国际工程智能联盟”全球倡议

上观新闻 浏览 2715

死亡人数增至44人!香港大埔火灾背后的宏福苑已42年楼龄

红星新闻 浏览 2969

看完《逐玉》我承认我还是喜欢长剧

时尚COSMO 浏览 1289

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 3389

郭爸曝郭碧婷家庭花销全靠她,嫁入"假豪门"?

代军哥哥谈娱乐 浏览 3419

国庆长假,基层的你休了几天?

识局 浏览 3408

郭富城三胎得女,四大天王未能迎来首个男孩,压力又给到郭富城了

扒虾侃娱 浏览 3192

专访陶一伟:离开特斯拉,用300美元“开源手”挑战老东家

蓝鲸新闻 浏览 3216

2026款途昂Pro限时一口价25.99万,全境安全大7座SUV新标杆

车之天下 浏览 671

"3.7万起拍做岛主"消息引发热议 官方回应

都市快报橙柿互动 浏览 5630

蔚来多款车型推出电池月租付一赠一限时优惠

网易汽车 浏览 2376

智能体系统如何「边做边学」?斯坦福团队探索在线优化的新范式

机器之心Pro 浏览 3260

马杜罗:愿在相互尊重基础上同美国进行对话

澎湃新闻 浏览 2529

冬季穿搭要避开臃肿感!配色不老气、穿衣不随意,越看越高级

静儿时尚达人 浏览 1491

为了挡住豆包,腾讯撒出10亿红包

中国企业家杂志 浏览 2120

郭晶晶白天带孩子爬山,晚上在大学演讲

小娱乐悠悠 浏览 1247
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1