关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3499人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

30万分手费vs3000万求婚钻戒:一个前妻的修养

Yuki女人故事 浏览 3935

球迷态度:颜王刘三人均已34+,李昊今年能否接班国足一门?

懂球帝 浏览 3470

牛弹琴:针对16岁以下的孩子 澳洲干了件前所未有的事

现代快报 浏览 8612

平台终端双落地,河南移动数智赋能低空经济产业园

大象新闻 浏览 4854

仅上任两个月!某车企董事长突然辞职

汽车工程师 浏览 3532

三战全胜,巴列卡诺主帅伊尼戈-佩雷斯当选西甲10月最佳教练

懂球帝 浏览 4396

女子取240万现金"给外甥当彩礼" 外甥:根本没有对象

环球网资讯 浏览 13967

新款小米SU7计划春节前到店 预售22.99万起

网易汽车 浏览 3378

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

静儿时尚达人 浏览 4197

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 9338

某券商首席炒黄金期货大赚14亿?本人报警了

财通社 浏览 3510

主打新潮科技 smart精灵#6内饰官图发布

车质网 浏览 1940

日本大妈的穿搭技巧太绝了!照着学,随便穿也能显年轻10岁

静儿时尚达人 浏览 4090

成败AI:谷歌市值超越苹果

北京商报 浏览 3444

韩国知名潮牌宣布将关闭中国全部门店 陆续打折清仓

潇湘晨报 浏览 10069

王传福:全世界NO.1的卷王

燃擎频道 浏览 3381

NBA碎碎念合集(2)

静易墨 浏览 4384

德国央行行长扬言:得想想如何报复中国

澎湃新闻 浏览 11176

透视以胡“超音速博弈”背后的攻防密码

浏览 8203

苏丹快速支援部队宣布同意实行人道主义停火

国际在线 浏览 4199

光峰科技“认领”闪极AI显示眼镜S1:采用蜻蜓G1 mini光机

IT之家 浏览 3606
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1