关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3405人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日政坛震荡首相或换人 石破茂一句话判高市早苗"死刑"

北回归线 浏览 14813

爱尔眼科,暗藏玄机!

飞鲸投研 浏览 3412

76岁“欢喜哥”许绍雄病危,tvb多名艺人紧急探望,众人神情严肃

不八卦会死星人 浏览 4281

多位老人痴迷买保健品:有人甚至吞安眠药逼女儿妥协

新京报 浏览 7275

她的发型又火了!年底做头发,不妨从这篇找找灵感

黎贝卡的异想世界 浏览 3518

尤斯特:我目前核心目标是保持巴萨稳定,让球队不受外部干扰

懂球帝 浏览 2626

人工智能时代如何深化跨区域知识产权保护协作,嘉定这场论坛进行了探讨

上观新闻 浏览 3535

兰帕德有能,考文垂队史首次取得单赛季联赛六连胜

懂球帝 浏览 4410

哈马斯领导人空缺15个月后重组在即 2人成为热门人选

红星新闻 浏览 8684

抢占本土聊天机器人市场,印度AI企业Sarvam推出Indus应用

IT之家 浏览 2811

黑芝麻控制权转让新进展:尽职调查10月底前收尾,国资注入能否解 “冲饮困局”?

时代周报 浏览 4555

伊朗并未请求延长停火 伊高官:必须武力回应封锁

财联社 浏览 1615

淘宝闪购立下 Flag 争第一,美团也不让步

雷峰网 浏览 3428

黄景瑜将上太空,官宣成为009号太空游客,乘坐中国自制飞船升空

扒虾侃娱 浏览 3316

抖音发布2025直播治理白皮书,违规曝光量减少37%

财闻 浏览 3427

日本企业搞出“玫瑰香轮胎”

轮胎报官方 浏览 3697

四足机器人首次同时「思考+走路」,北大提出链式推理MobileVLA-R1

新智元 浏览 3915

再论快船用鲍威尔交换科林斯 后者17场后被甩卖卢指导难辞其咎?

仰卧撑FTUer 浏览 4102

广西10人打零工掉入暴涨的江中遇难:有1家3人身亡

澎湃新闻 浏览 23526

法尔克:水晶宫确实非常难对付,如果能保持零封就更完美了

懂球帝 浏览 3855

付豪:其实我们比球迷更想赢球,但球队实力与过去不可同日而语

懂球帝 浏览 3583
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1