关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4394人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

1.78万亿宁德时代牵手“张雪”,造出电摩给谁骑?

野马财经 浏览 1875

弗里克:很不满意拉菲尼亚受伤;还没和特尔施特根聊过

懂球帝 浏览 3262

记者问美防长戴"俄国旗颜色领带" 五角大楼:你妈买的

环球网资讯 浏览 9205

洋河股份变脸!取消70亿保底分红,2025年利润暴雷

杠杆游戏 浏览 3389

最便宜GLS 2026款奔驰GLS经典版售96.8万

网易汽车 浏览 3804

笑不活了!网友集体冲进李亚鹏账号评论区,各种神评涌现太离谱!

娱乐圈笔娱君 浏览 3739

这个吴邪,还真不是谁演都能火的。

伊周潮流 浏览 3669

终于!短剧向经典IP出手了

艳姐的搞笑视频 浏览 4448

马杜罗纽约"首秀"神态轻松 比"V字剪刀手"遭多方解读

红星新闻 浏览 9309

冬天的“销冠”,已被羽绒服预定

时尚COSMO 浏览 3317

一架无人机保护区拍鸟群致鸟摔死 无人机被人悄悄捡走

中国新闻周刊 浏览 11278

NVIDIA显卡真变砖了!买了一张RTX 5080:收到却是真砖块

快科技 浏览 5185

解放军代表质问日防卫大臣:日本何时道歉

环球网资讯 浏览 503

范德芬:我知道我加速后别人很难追上,那一刻只想着必须进球

懂球帝 浏览 4266

希罗赛季首秀24+7热火险胜独行侠夺5连胜 状元14中5华盛顿27+8

醉卧浮生 浏览 4037

苹果计划推出全新搭载摄像头的AirPods,舜宇光学科技盘中大涨9%

财闻 浏览 4

法媒:美国将德国最大贸易伙伴地位拱手让给中国

参考消息 浏览 9283

宗馥莉“被带走”?谣言背后,一个内讧的娃哈哈

大猫财经Pro 浏览 3831

新增AI试穿场,淘宝510答题免单零点已上线

财闻 浏览 1253

女鞋巨头,集体“脱鞋”谋变

斑马消费 浏览 3419

特朗普亚洲行美方称中美领导人将会面 中方尚未官宣

上观新闻 浏览 9374
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1