关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4716人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高盛:人工智能热潮并非泡沫,才刚刚起步

IT之家 浏览 4456

外媒:中法元首会谈议题十分广泛 似乎找到更多共识

环球网资讯 浏览 37110

美乌代表:佛州会谈"富有成效和建设性"

上观新闻 浏览 3772

美国防部将提供“战斧”决定权交给总统

国际在线 浏览 4214

被预制菜笼罩,商场餐饮大撤退?

餐饮老板内参 浏览 3719

哈登致意艾弗森:我现在所经历的一切,正是当年你走过的路

懂球帝 浏览 529

卢浮宫抢劫案两嫌疑人均30多岁 一人试图登机离境被抓

极目新闻 浏览 9371

健康活到100岁,科学能做些什么?@U35张汉林试图寻找衰老背后的“隐藏逻辑”

上观新闻 浏览 3577

状态不佳,阿森纳对阵森林上半场8脚射门0射正

懂球帝 浏览 3358

西蒙尼:巴埃纳在不同位置都能帮我们;我们有很大提升空间

懂球帝 浏览 4159

告别“嘴炮自研”:当第一批L3牌照下发,车企要为你的双手负责了

道哥说车 浏览 3672

码住抄作业!春节见人不翻车就靠这8样!

Yuki女人故事 浏览 3402

看完翁青雅的“车祸现场”,大家不再骂朱丹了

宛沐 浏览 4111

乌克兰决定与尼加拉瓜断交

参考消息 浏览 3440

英伟达联手诺基亚,能否复制“Wintel神话”

经济观察报 浏览 4289

皇马TV显示,贝林厄姆将在国家德比中担任首发右边锋

懂球帝 浏览 4421

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 34133

秦岚自曝身体出现情况,治疗结果不尽人意

乡野小珥 浏览 2764

电池技术取得重要突破,新能源车续航里程有望翻倍

环球网资讯 浏览 4595

李施嬅和车崇健确认已分手,她值得更好的!

黔乡小姊妹 浏览 3503

台学者:台当局不办光复节活动 人民无法接受

环球时报新闻 浏览 9897
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1