关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻957人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

研究称AI写的微博比真人的更让人信服,无论话题真假

网易科技报道 浏览 15924

下周关注|进博会等多个重要活动将举办, 这些投资机会最靠谱

第一财经资讯 浏览 742

作秀式调研书记涉案超1亿:支持他人写书宣扬其"功绩"

新京报 浏览 75229

不是这个,重新发皇马官推今日第二推:10魔笛+5贝林=15冠

直播吧 浏览 11209

美防长患前列腺癌瞒着拜登 专家:其并发症很罕见

新京报外事儿 浏览 12527

今日热点:ador或将拒绝newjeans另外三人回归#;徐晟津就星辰大海睡觉道歉……

伊周潮流 浏览 550

菲律宾接收两架武装直升机 声称将"显著提升海岛作战能力"

澎湃新闻 浏览 11070

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 889

刘嘉玲好敢说!问柯淳不谈恋爱生理没需求么?柯淳回答堪称教科书

娱乐圈笔娱君 浏览 745

知名高校毕业典礼校长雨中致辞 书记悄悄站身后帮撑伞

每日经济新闻 浏览 92383

看了观众对何赛飞的评价,我才明白当年郭宝昌那番话的含金量

娱乐圈笔娱君 浏览 808

中国脑机接口发展提速:“机智”上新,从实验室走向市场

第一财经资讯 浏览 10835

记者:加拉塔萨雷租借恩东贝莱达协议,选择买断费1500万欧

直播吧 浏览 14283

消费股大爆发,但背后另有玄机!

君临财富 浏览 648

25岁西班牙女博主在相亲角被50岁男士求婚:感觉怪异

上观新闻 浏览 78029

美媒:报告称,东南亚成美国电子垃圾倾倒场

环球网资讯 浏览 880

为什么宋朝这么弱却有320年的历史?

趣看热点 浏览 25665

这位“AI教父”怎么总炮轰ChatGPT?

36氪 浏览 15363

欧洲杯1/4决赛,意大利2-1战胜比利时,晋级欧洲杯四强

趣看热点 浏览 26048

郭晶晶就个人发展问题最新发声

新民周刊 浏览 948

欧阳娜娜的姐姐欧阳妮妮与张书豪牵手,举动无比亲密!

趣看热点 浏览 26320
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1