爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

反对马斯克 ...

由内而外大变...

吊打比亚迪、...

向华强说娱乐...

直击MWC2...

特斯拉全球第...

网红版闫学晶！600万粉博主阿爆翻车

收藏！2026乒乓赛历出炉：全年63站以上，运动员体能迎来严峻考验

「好想来」与鸣鸣很忙，谁都成不了蜜雪冰城

哈马斯证实达成加沙停火协议

央视中秋宋佳大气唐嫣美艳，侯佩岑主持功底深，谢娜受邀另有原因

“胡润富豪”扎堆的“家族办公室”是啥？

泽连斯基：乌克兰计划2027年加入欧盟

推广|| 她们新年状态大开挂？原来悄悄做了这笔“美丽投资”

冬奥总结：雪上项目当主角中国刷新境外参赛最佳

鹈鹕创队史纪录大胜独行侠状元PK锡安27分弗拉格21+7+8

中国最会化妆的男富豪，一把套现15亿！什么信号？

俄称击退乌军解围行动乌称击退俄军进攻

“9系”旗舰+1 上汽大众的战略反攻

2025年，记住她们的名字！

官方：阿根廷U20主力中卫皮耶拉尼左膝扭伤；据悉无法出战半决赛

中国公民需谨慎前往日本四大原因披露

网友称小区1楼4户业主联合私挖地下室官方回应

走过那个夏天，甜茶终于站上金球奖之巅

整合再提速！“东方证券+上海证券”合并预案出炉

钉钉推出全新AI原生工作平台“悟空”

2026开年，就创造了10个“第一”，这国综后劲真大

解码2025年SUV销量王，藏在爆款里的家庭用车消费新逻辑

梁洛施的骨相，女娲毕业设计

年底盈利即将兑现蔚来Q3财报公布