关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者2239人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 6995

如果可以,希望鲁豫老师再工作30年!

时尚COSMO 浏览 2429

续火花:不间断的敷衍,就是真诚

时尚COSMO 浏览 2736

定位顶级奢华MPV 奔驰VLE测试谍照曝光

车质网 浏览 2782

威胁要对盟国加征关税后 特朗普亲率代表团出席达沃斯

澎湃新闻 浏览 11825

无止境,梅西常规赛28场贡献29球16助攻

懂球帝 浏览 3297

目标直指绝对第一:阿里为淘宝闪购按下份额扩张“加速键”

华尔街见闻官方 浏览 2415

维持看涨!摩根大通预计金价明年底均价升至5055美元

第一财经资讯 浏览 3350

伊朗称美国在伊核问题上“没有认真的谈判态度”

国际在线 浏览 2913

市值26亿豪掷32亿跨界“钠电”,环保企业“同兴科技”胜算几何?

时代周报 浏览 2576

苏州大学突破:新型注意力机制赋能AI语境适应性对话

科技行者 浏览 2121

萝卜快跑计划将业务扩展至澳洲和东南亚

盖世汽车 浏览 4020

宝马5系车主揪出汽修店一个"意外疏忽":我气得吐血

1818黄金眼 浏览 5993

伊朗伊斯兰革命卫队:击落一架美军搜救飞机

财联社 浏览 628

49岁舒淇终于承认不孕,备孕9年无果一度抑郁

小娱乐悠悠 浏览 2985

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 3159

当众辱骂阿隆索!1.5亿欧熊皇惹怒老佛爷+更衣室 皇马准备处罚他

风过乡 浏览 3284

“工业机器人曾是日本的堡垒,但中国已开始在新轨道上竞争”

观察者网 浏览 2739

蓝箭航天冲刺商业火箭第一股 万亿赛道谁最受益?

21世纪经济报道 浏览 2337

质疑公牛集团广告语存误导被索赔420万 涉事公司反诉

澎湃新闻 浏览 20369

阿里正把自己装进赛博分身

虎嗅APP 浏览 2227
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1