关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4392人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

都有哪些业绩稳健的基金?

阿尔法工场 浏览 3712

罗体:萨里向洛蒂托要求在一月引进一名高水平中场球员

懂球帝 浏览 4032

古巴外长批评美国内政外交双重失序

国际在线 浏览 3450

官方:瑞典裁判尼贝里将执法欧冠热刺vs多特

懂球帝 浏览 3374

日本拟引进乌无人机 其防卫预算首次突破9万亿日元

扬子晚报 浏览 126700

带着理想出发:理想汽车携手易烊千玺为时代青年发声

三言科技 浏览 5111

红果年度男演员排名出炉,刘萧旭碾压登顶

洲洲影视娱评 浏览 3480

连续三个月创历史新高 蔚来公司10月新车交付首超4万台

网易汽车 浏览 4297

《逍遥》结局揭秘:糖衣之下,是千年人妖血泪博弈

肆季娱乐 浏览 3725

国米本赛季11粒进球中4粒来自角球,身高超1.88米的球员有10位

直播吧 浏览 5168

今年秋天的卫衣,放松穿最好看!

LinkFashion 浏览 4778

baby近照脸好僵!被质疑打针了没恢复,37岁了又拍网红照太心酸

萌神木木 浏览 1221

高市早苗再有新动作日本准备拥有核武 中俄要早做准备

头条爆料007 浏览 45891

奔驰“小G”海外路试谍照曝光

大象新闻 浏览 4102

俄白联合军演两名美军军官"意外现身" 白俄防长:可随意参观

环球网资讯 浏览 5250

baby相隔17年同角度怼脸拍!全脸变化肉眼可见

萌神木木 浏览 2800

全国人大代表梁伟:用AI打通中国芯片弯道超车的 “任督二脉”|代表在这里

封面新闻 浏览 2670

业主84万元新房被粪水环绕崩溃 管道一天排粪水10余次

潇湘晨报 浏览 7506

蓄发哥开始重新等待五连胜,阿莫林:希望他能尽快剪掉头发

懂球帝 浏览 4219

跨年档票房惨淡!5部新片全部倒挂,《寻秦记》情怀满满却难回本

萌神木木 浏览 3696

瀚森真实命中率联盟垫底!断层落后倒数第二 投篮能力需大幅提升

罗说NBA 浏览 2804
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1