关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3407人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

范巴斯滕谈意甲外资:意大利若想重返欧洲顶级,得让意大利自己人掌控

懂球帝 浏览 1297

莱万特3-0大胜塞维利亚,卡洛斯-阿尔瓦雷斯、卡洛斯-埃斯皮破门

懂球帝 浏览 3512

赚了钱,反而有人说小鹏不是“小鹏”了?

速度计 浏览 3774

北约秘书长斩钉截铁:欧洲永远离不开美国

扬子晚报 浏览 23699

新年第一周,省委书记密集提出新要求!

国是直通车 浏览 3451

全是感动!《许我耀眼》33集大结局,是我今年看过最泪奔的大结局

娱乐圈笔娱君 浏览 4482

媒体:郑丽文当选回复大陆贺电 表述难得一见意义重大

经济观察报 浏览 9612

小米SU7高速碰撞后起火 事发前速度或超200km/h

网易汽车 浏览 4542

业主反映多户顶楼业主违规加盖房屋 持续多年无法拆除

红星新闻 浏览 8252

Windows 10,即将“停服”

第一财经资讯 浏览 4528

跨年档、抓总统、何晴、南京博物院、斩杀线等

电影最TOP 浏览 3061

外套真的没有必要买太多,准备这几件大衣就足够,简单耐穿又百搭

静儿时尚达人 浏览 2524

中美欧大市场带动,全球车市1-9月销量涨5%

汽车公社 浏览 4258

洪秀柱警告日本别惹事:小日本不要太嚣张

北京日报 浏览 2739

60岁无儿无女形象大变的张卫健,经历了什么

草莓解说体育 浏览 4382

欧盟限制中国企业参与5G建设,商务部回应:坚决反对

时代周报 浏览 3312

夫妻争吵男子抱起一个孩子扔河里 夫妻俩随即跳河救娃

上观新闻 浏览 39149

有大梁更能装也智能 奇瑞威麟R08 EV上市12.78万起

网易汽车 浏览 3267

长电科技副总裁吴伯平:3D异质集成加速迈向系统级架构创新

爱集微 浏览 634

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 3723

今晚发布,OPPO Find X9 系列手机提供 eSIM 版本

IT之家 浏览 4587
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1