关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3495人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

离婚7个月,霸总杨子又给内娱上了一课

老吴教育课堂 浏览 3874

中国武器出售清单大曝光:有了这些你就是大爷

浏览 8179

4岁女童在温泉酒店泳池溺水 两名女子跪地抢救20分钟

红星新闻 浏览 93133

蒋凡重启阿里:一场AI重构内核的千亿实验

博望财经 浏览 4510

贵金属风口催生7连板!白银有色涨势凌厉,基本面却“拖后腿”

览富财经网 浏览 3376

笑星冯淬帆离世

萌神木木 浏览 3578

firefly萤火虫第4万辆交付 售11.98万元起

太平洋汽车 浏览 3483

金融文化实践录丨深耕特区发展沃土 厚植金融文化根基

证券市场周刊 浏览 4274

日本前首相:中国批高市理所当然 日媒为什么不批

环球网资讯 浏览 16848

北京自闭症男童苍山走失身亡 父亲1周7天扎在单位加班

红星新闻 浏览 9317

“疲惫脸”太丑了!有这些特征的女生怎么救?

Yuki女人故事 浏览 4929

倾家荡产120万上星光大道,她如今怎样了

青橘罐头 浏览 4655

苹果发完M5芯片,最开心的是M1钉子户

机器之心Pro 浏览 4477

AMD ROCm 软件堆栈更新至 7.0.2 版本,支持 Radeon RX 9060 显卡

IT之家 浏览 4592

男子带患阿尔茨海默症的妻子跑网约车:1年仅两个退单

潇湘晨报 浏览 33189

球迷态度:中越大战安东尼奥大胆变阵,U23国足能否再创历史?

懂球帝 浏览 3344

《爱人5》邓莎率先翻车!后悔嫁富商遭吐槽:图钱就别要情绪价值

萌神木木 浏览 4557

震惊世界的3小时:美国“闪击”委内瑞拉的事实与疑问

南方都市报 浏览 3562

理查兹:道曼和萨卡位置重叠,为球员未来发展应该将他外租

懂球帝 浏览 4229

今年春天最流行的6件风衣!

LinkFashion 浏览 2792

上海女子崩溃:前夫为泄愤下载群发三甲医院病历

极目新闻 浏览 10336
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1