关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3574人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

央视中秋宋佳大气唐嫣美艳,侯佩岑主持功底深,谢娜受邀另有原因

不八卦会死星人 浏览 3438

申花2-0首尔获亚冠首胜!终结对韩国球队4场不胜 阿苏埃破僵+伤退

我爱英超 浏览 3376

美国1-1厄瓜多尔,恩纳-瓦伦西亚破门,巴洛贡扳平

懂球帝 浏览 3419

男子在悬崖边请人拍照滑倒坠下 遗体在水潭底部被找到

封面新闻 浏览 8959

女友BELLA+封面 | 高杨:步履稳定,心向未知

伊周潮流 浏览 2839

贝克汉姆率领一家7口亮相,唯独大儿子布鲁克林和妮可拉缺席

素素娱乐 浏览 2065

AI如何助力空调“降温”过程中更节能,珠海这场论坛揭秘

南方都市报 浏览 3421

阿斯:卡瓦哈尔已具备首发的状态,阿诺德预计周末回归名单

懂球帝 浏览 2072

纯电版奥迪A6亮相!外观很动感,配800V架构+5块大屏,续航785Km

小史谈车 浏览 2752

羊绒专场 || 被大家问了无数次的经典款,终于回来了!

黎贝卡的异想世界 浏览 2861

增持回购潮背后的A股信心

北京商报 浏览 2928

比亚迪元PLUS高功率版曝光 电机功率增至230千瓦

网易汽车 浏览 3561

“强制接管”, 西方这是明抢了?

观察者网 浏览 3460

合资品牌的“下一程”,为什么要从CR-V谈起

汽车预言家 浏览 2629

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 3244

海南自贸港全岛封关运作将启动!商务部:将以此为契机,大力推进制度型开放

红星资本局 浏览 2742

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 2391

热度破9000,赵丽颖谭松韵令观众成功入坑,这部年底压轴剧太生猛

娱乐圈笔娱君 浏览 2560

女子开宝马住高端小区却偷榴莲 保安提醒后她又拿2件

潇湘晨报 浏览 90398

皮耶罗儿子被意丁俱乐部解约,俱乐部主席:我们不看他的姓氏

懂球帝 浏览 2668

法尔克:对没拿到三分有些失望,但对曼联拿到一分也是不错的

懂球帝 浏览 2381
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1