关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro3278人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

技术+临床双向赋能成都脑机接口产业 迎来新机遇

封面新闻 浏览 1638

金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

红星新闻 浏览 3226

“军国主义”为何能在日本存续下来

国际在线 浏览 3973

男子凌晨打车嫌98元车费太贵 和的哥在派出所耗到天亮

环球网资讯 浏览 8951

E句话|“我只眼神给出去”?黑白颠周媛账号被封

仙女事件簿 浏览 3239

38岁何洁二婚丈夫刁磊,已经开始为她“争光”了

余鴡搞笑段子 浏览 4198

英国安德鲁王子放弃王室头衔 被指与未成年人发生关系

CCTV国际时讯 浏览 10429

35岁男子回乡"崖下洞居" 创业失败家里没房欠银行35万

封面新闻 浏览 17237

何猷君法国婚礼高调奢华,奚梦瑶行头4500万

喜欢历史的阿繁 浏览 489

王楚钦战满5局,林诗栋横扫!国乒3-0完胜韩国,跻身世乒赛四强

全景体育V 浏览 1241

"柴怼怼"被逮捕:因"打假"走红后售假 有人消费近10万

澎湃新闻 浏览 9076

AI算力需求疯狂,微软“新云”交易额超600亿美元

华尔街见闻官方 浏览 4201

五粮液第三季度营收、净利润同比分别下降52.66%、65.62%

红星资本局 浏览 4457

理发店主阻拦城管撕广告 冲突中被1名胖城管咬伤手指

大风新闻 浏览 6596

苏翊鸣:我仍是那个热爱单板滑雪的少年,下个周期或许别样精彩

懂球帝 浏览 2875

王浩然三分绝杀,深圳95-92险胜山东,克里斯空砍30分

懂球帝 浏览 3763

福特总部70年来首次搬家

MOTO 浏览 5107

走过五年黑暗隧道后,江小白靠一瓶酒杀回来

财经无忌 浏览 3409

欧豪:16岁送外卖,21岁遇到贵人谢霆锋

韩驰 浏览 3579

赵露思:退圈72天,反转太快

Yuki女人故事 浏览 4259

以色列:随时重返战场

极目新闻 浏览 1852
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1