关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3147人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

白宫黑手伸进委总统卧室!一场践踏国际规则的“黑夜绑架”

国是直通车 浏览 2467

Meta被曝靠诈骗广告赚取巨额利润

北京商报 浏览 3155

当美妆变成快消品,为何还需要一件“传家宝”?

时尚COSMO 浏览 5306

伊姐周六热推:电视剧《年少有为》;电视剧《有罪之身》......

伊周潮流 浏览 2145

李婉华:但凡他跟我求婚,我都不会另嫁他人

艳儿说电影 浏览 3431

国米取胜后距榜首1分,罗马如果能客胜米兰将独自领跑积分榜

懂球帝 浏览 3241

杜锋真会整活!张昊配张文逸无球权,内线上两站桩,全运会别瞎搞

篮球资讯达人 浏览 3379

颜丙燕公开恋情 男友小她20岁,被误认成“儿子”

韩小娱 浏览 3423

腾讯首次系统披露研发进展:AI生成50%新增代码,研发自动化水平同比提升67%

华尔街见闻官方 浏览 3400

李璇:三镇开出国内球员顶薪与邓涵文续约,但没能续约成功

懂球帝 浏览 2780

直播|| 降温天的居家幸福感,是它们给的

黎贝卡的异想世界 浏览 3157

马杜罗在美首次出庭表示不认罪:我仍是委内瑞拉总统

每日经济新闻 浏览 5796

莱因克尔:慢放让西蒙斯的动作看起来很夸张,其实黄牌就够了

懂球帝 浏览 2664

海上风电产业发展提速

商业观察杂志社 浏览 636

阿尔伯塔大学新突破:让AI学会自我检查错误,准确率远超人工审核

科技行者 浏览 2371

再论快船用鲍威尔交换科林斯 后者17场后被甩卖卢指导难辞其咎?

仰卧撑FTUer 浏览 3000

经典之上再造经典 BJ40探险家上市 13.49万元起

网易汽车 浏览 2232

张柏芝与向太的关系彻底崩塌?

涵豆说娱 浏览 3844

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 2317

自动驾驶真的来了 两款车型分别在北京/重庆获准上路

网易汽车 浏览 2689

宗馥莉的两大心腹疑似离职,“宏胜系”权力大洗牌

财通社 浏览 3355
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1