关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者4224人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

多位老人痴迷买保健品:有人甚至吞安眠药逼女儿妥协

新京报 浏览 7276

中国最北端宜家即将闭店 东三省仅剩辽宁有宜家可逛

极目新闻 浏览 9318

奇瑞再次否认与追觅合作:双方并未进行合作签约

IT之家 浏览 3630

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 4313

张雨绮,不能「装死」了

独立鱼 浏览 3263

东华测试寻求打开机器人领域新空间

爱集微 浏览 4379

4岁女童在温泉酒店泳池溺水 两名女子跪地抢救20分钟

红星新闻 浏览 93133

U23亚洲杯疯狂一夜:韩国4-2逆转 日本3-0接近进8强 中国队争首胜

侃球熊弟 浏览 3398

还是他,太敢说了!果然有些车企,只是把激光雷达卖给你,当摆设

小李车评李建红 浏览 3712

美军演练与解放军大规模作战 专家分析

北京日报 浏览 2481

新势力比传统车企更乐观,2026年车市充斥着哪些挑战?

汽车头条APP 浏览 3277

弗莱彻首战曼联将用四后卫,B费请缨出战!新帝星已撤回转会申请

罗米的曼联博客 浏览 3515

将于二季度上市 蔚来ES9实车曝光还有双色车身

网易汽车 浏览 3454

阿里前主席张勇,花5354万港元买了套香港半山豪宅

财通社 浏览 4317

球队新闻:凯文进入比赛名单

绿茵情报局 浏览 1219

女子98万买新房交付前感觉被坑了:设计师都"惊呆"了

1818黄金眼 浏览 16281

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 4273

海外投资者争做基石!摩根大通:中国药企全球竞争力提升,投融资持续活跃

券商中国 浏览 4395

计划对菲律宾出口防空导弹 日本危险动作引担忧

上观新闻 浏览 3911

全球第二,欣旺达,再冲固态电池!

飞鲸投研 浏览 4512

中方代表当场质问日方:你们从来没有真正地认罪悔过

环球网资讯 浏览 13033
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1