关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3575人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉斯帕多里:意大利拥有成功所需的一切;我对加盟马竞很满意

懂球帝 浏览 2829

泽连斯基称俄乌和平协议无简单解决方案 普京发声

每日经济新闻 浏览 2735

鹿晗的“体面”,终于被关晓彤撑起来了

娱乐圈笔娱君 浏览 2412

闻泰科技营收147亿的半导体资产被荷兰政府冻结

每日经济新闻 浏览 3409

以防长威胁伊朗:准备好重启战事 就等美国“开绿灯”

上观新闻 浏览 35

伊朗竖起巨幅宣传画:一艘美军航母被炸

每日经济新闻 浏览 2147

卓正医疗通过IPO备案:年营收6.9亿 腾讯与H Capital是股东

雷递 浏览 4073

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 3245

中航大学:AI聊天机器人的"假身份证"攻击如何骗过智能助手

科技行者 浏览 3295

超微电脑Q1财季营收大幅下滑15%,毛利率暴跌至9%,盘后股价重挫10%

华尔街见闻官方 浏览 3087

蔚来法务部回应遭网络侵权:已报案并获法院判决支持

智车情报局 浏览 3393

女生晒春运"出国回家"攻略:连飞俄两地再坐船回黑龙江

上游新闻 浏览 21846

命名Peaq 斯柯达全新纯电七座SUV今年发布

车质网 浏览 2231

每秒可传 1250 万部高清电影,亚马逊启动跨大西洋海底光缆项目

IT之家 浏览 3114

冲着唐嫣去看《爱情没有神话》,却被演反派的冯绍峰吸引了

温柔娱公子 浏览 3412

印尼国脚小赖因德斯:这段旅程始于梦想,如今却以痛苦告终

懂球帝 浏览 3519

全球牛肉“通胀”,中国市场价格为何“独稳”

北京商报 浏览 3149

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

静儿时尚达人 浏览 3074

"四大天王"被网友笑称"四大岳父" 最年轻的黎明已59岁

极目新闻 浏览 7576

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

钛媒体APP 浏览 3094

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者 浏览 2255
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1