关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者3380人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

伊周潮流 浏览 1938

上市15天,摩尔线程剑指英伟达腹地

虎嗅APP 浏览 2575

特朗普:我也不想 但我们确实从乌克兰战争中赚到钱了

澎湃新闻 浏览 20995

燕翔:A股上市公司增减持特征与近况

首席经济学家论坛 浏览 3303

2米高台直坠!41岁张靓颖摔出尖叫

东方不败然多多 浏览 3410

海军四川舰顺利完成首次航行试验

央视新闻客户端 浏览 2226

丹麦尴尬:抵制美国代价高昂 却眼睁睁看着格陵兰离开

澎湃新闻 浏览 7045

伊媒发布小学被炸瞬间 战斧导弹从天而降

潇湘晨报 浏览 1265

寻找AI无法替代的最后一公里丨去现场 做原创

封面新闻 浏览 3055

父母先后失联兄弟流浪4岁弟弟又失踪 36年后母子团圆

红星新闻 浏览 7604

人类遗忘的难题解法,被GPT-5重新找出来了

量子位 浏览 3428

中国最北端宜家即将闭店 东三省仅剩辽宁有宜家可逛

极目新闻 浏览 8157

飞傲雪漫天BEATBOX便携CD播放器亮相,预计明年2月上市

IT之家 浏览 2644

香港著名女星,为照顾儿子淡出娱乐圈

秋枫凋零 浏览 2294

Jacob Elordi 最新电影造型,好像鬼!

下水道男孩 浏览 3255

希尔德:追梦可能是篮球史上的最强防守者,他在防守端功力深厚

懂球帝 浏览 3489

复旦大学:人工智能在太空中的大考验——能否胜任星际调度师?

科技行者 浏览 2116

美股三大指数收盘齐创新高,英特尔涨超22%

中新经纬 浏览 4173

山东99-75战胜宁波 球员评价:3人优秀,5人及格,2人低迷

篮球资讯达人 浏览 2162

1月销量环比暴跌超20%!雷军:一季度本就是汽车销售淡季,且初代SU7已停售

商用车头条 浏览 2064

欧洲8国集体反击特朗普 英国首相:将与美国政府交涉

极目新闻 浏览 6421
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1