关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者922人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

陈百祥做客直播吧|阿叻哥答吧友问来啦!他说自己要做国足教练...

直播吧 浏览 16810

英女足国门:对英格兰队来说外界施压很正常,小伙子们能搞定

直播吧 浏览 10492

专家:网攻武汉地震监测中心黑手具有明显军事目的

环球网资讯 浏览 14739

哈马斯官员:未收到重启加沙停火谈判通知

环球网资讯 浏览 10787

奥迪Q8 e-tron达喀尔版官图发布,将限量发售99台

天天汽车 浏览 12600

媒体:中美在"香会"唇枪舌剑 美国高官"跑步"访华

直新闻 浏览 17046

媒体:传来两个与石油相关的好消息 都与中国有关

上观新闻 浏览 16458

台外事人员被爆烧瑙鲁国旗“泄愤”被瑙鲁人报警

环球网资讯 浏览 12659

媒体:美军进驻芬兰基地 俄北方舰队受严重威胁

环球网资讯 浏览 13087

7天仅带货30多万,重启失败后,天涯创始人称最坏打算是卖掉天涯

每日人物 浏览 16532

美不美看打扮!超实用的气质穿搭套路

静儿时尚达人 浏览 13295

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 632

美媒:拜登批准乌军用美供武器打击俄本土

环球网资讯 浏览 11286

已减重10公斤的泫雅澳门演出晕倒后公开致歉

封面新闻 浏览 647

"分割顿巴斯"提议遇阻 北约秘书长赴美会谈

环球网资讯 浏览 845

外媒称中国正建设第四艘航母 国防部回应

财联社 浏览 1502

2023秋冬五大流行趋势 属于新时代女性的时髦

LinkFashion 浏览 16086

秋天穿衣没那么难,快从这些穿搭中收获灵感,显瘦又不落俗套

静儿时尚达人 浏览 2047

男子花4万为父母升头等舱 手机遗失被安全员占为己有

鲁中晨报 浏览 1075

先做一手准备,阿斯:哈维派了三位分析师看马德里德比

懂球帝 浏览 12547

雷克萨斯全新轿跑车曝光!V6引擎搭配后驱

网上车市 浏览 12705
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1