关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3562人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中戏否认闫学晶儿子读新疆班,曾参加全国统一考试,网传消息不实

扒虾侃娱 浏览 2347

张元英又作大死?香港相关言论炸锅了

小徐讲八卦 浏览 2541

追觅超跑亮相CES 1903马力 零百加速仅需1.8秒

网易汽车 浏览 2382

乌称1200名乌被俘人员将获释 俄方暂无回应

新京报 浏览 2971

具俊晔暴瘦现身,搀扶着S妈,小S神情哀伤,范玮琪夫妻同行

素素娱乐 浏览 2100

联盟各队在恐慌雷霆 战绩第一还手握快船2026年首轮签

仰卧撑FTUer 浏览 2837

行业「寒风」尤劲,龙头企业华润三九能否「独善其身」

节点财经 浏览 3295

起底Plaud不融资却卖100万台的秘密

虎嗅APP 浏览 3031

吉利汽车2025年全年累计销量超302万辆

网易汽车 浏览 2453

采用增程动力 极石ADAMAS将于12月17日上市

车质网 浏览 2880

小鹏汽车出海新动态:小鹏 MONA 正式发往中东非

IT之家 浏览 3038

伊朗:不再发射弹头不足一吨重导弹 增加发射频率和范围

财联社 浏览 1412

先锋来袭 丰田卡罗拉概念车新车图解

车质网 浏览 1569

郭碧婷父亲回应病危传闻,自我调侃幽默辟谣,近状曝光精神抖擞

扒虾侃娱 浏览 3428

10.58 万!零跑造了一台「红米 YU7」

极客公园 浏览 3143

辽宁98-86送北控3连败,威尔斯31+7,廖三宁9中9空砍22+7

懂球帝 浏览 2615

美军大兵压境 委内瑞拉发现一邻国与中情局勾结

上观新闻 浏览 2557

2天票房3亿,看完《疯狂动物城2》,我想说:好莱坞大片赌对了

娱乐圈笔娱君 浏览 2884

三年巨亏30亿,鹏华基金闫思倩的“光环”与持有人的“叹息”

一地基毛 浏览 3042

超3100家退出!保险分支机构加速“瘦身”

国际金融报 浏览 2334

始祖鸟发布道歉信 但海内外版本不一致

极目新闻 浏览 22294
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1