关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3570人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

天汽模五年四谋易主 陷增长瓶颈中期扣非降90%

长江商报 浏览 3987

通航城市超260个 我国四大世界级机场群建设初具规模

央视财经 浏览 3410

光大银行董事会换届减员,4名新面孔亮相

财经众议院 浏览 3806

“空中货拉拉”首飞背后:无人运输机争食1.5万亿元低空经济“蛋糕”

上游新闻 浏览 2363

特朗普宣布延长停火 伊朗表态

界面新闻 浏览 286

毛不易演唱会撒圆形纸钱,本人:这吉祥吗?

一家说 浏览 3927

法国:欧委会派员参加所谓"和平委员会"会议未获授权

界面新闻 浏览 1639

12月的奇迹,是“白”给的!

时尚COSMO 浏览 2112

汪小菲陪马筱梅拍孕肚写真,俯身听宝宝动态,幸福洋溢在脸上

素素娱乐 浏览 2152

《秋雪漫过的冬天》首播,不如原版韩剧好看

马庆云的影音娱 浏览 2387

一文读懂索提诺比率(附索提诺比率选出的牛基--普通股票型)

一地基毛 浏览 3293

孙东旭卸任东方甄选珠海公司职务

雷达财经 浏览 2503

所以《All Her Fault》,其实都是“他的错”?

时尚COSMO 浏览 2213

ESPN:因内马尔的身体状况和高额薪资,桑托斯不急于和他续约

懂球帝 浏览 3447

闫妮姚晨合拍大片,梦回《武林外传》

蕾爸退休日记 浏览 3170

博主成功拆解苹果 iPhone Air,刮去背板涂层打造“透明版”机型

IT之家 浏览 3356

普通人真该看看这些穿搭!短上衣配裙子、颜色选好,自然得体

静儿时尚达人 浏览 3481

梁朝伟谈《寂静的朋友》,它“改变了我与自然的关系”

幕味儿 浏览 2552

泽连斯基称俄罗斯正为更大规模冲突做准备 俄方回应

红星新闻 浏览 3984

詹姆斯坐骨神经痛进展:湖人计划让他11月中旬复出 将耐心康复

醉卧浮生 浏览 3413

女人会不会打扮很重要!配色不老气、穿衣不拖沓,耐看又大方

静儿时尚达人 浏览 618
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1