关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2059人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小区因千万接口费欠款致600户居民3年未供暖 多方回应

大象新闻 浏览 8342

两名国民党民代遭起诉 郑丽文:民进党想团灭在野党

海峡导报社 浏览 14057

记者:海港抵达武里南,莱昂纳多、加布、李帅、刘若钒伤缺

懂球帝 浏览 3161

何小鹏邀罗永浩体验 VLA:好产品不怕检验 罗永浩回应笑翻网友

快科技 浏览 1280

特斯拉 Model Y L 交流外供电适配器上架,售价 599 元

IT之家 浏览 3098

介绍一个如果你用了,你就看不到这篇文章的产品

时尚COSMO 浏览 2576

综合续航超1600km/配RTD可变阻尼悬架 别克至境E7官图发布

网易汽车 浏览 2351

2026年必追的四部谍战剧 陈道明、于和伟领衔主演

娱乐圈笔娱君 浏览 2227

锦缎观察:AI应用、储能与机器人在2026年的预期差

锦缎研究院 浏览 2304

OrangePi 6 Plus 开发板公布:12 核 CPU,双 M.2 SSD 双 5GbE

IT之家 浏览 3410

恩里克:登贝莱得流感了所以没来,我们已习惯这赛季没有他

懂球帝 浏览 2733

2025年度榜单|| 真金白银票选出来的“真爱”,今天破价1.6折!

黎贝卡的异想世界 浏览 2167

1月销量环比暴跌超20%!雷军:一季度本就是汽车销售淡季,且初代SU7已停售

商用车头条 浏览 2058

郭磊:如何认识最新的出口数据和出口形势

首席经济学家论坛 浏览 3461

命名Peaq 斯柯达全新纯电七座SUV今年发布

车质网 浏览 2225

特朗普签署行政令 对进口中型和重型卡车征收25%关税

央视新闻客户端 浏览 9599

中国曾经也有一家“OpenAI”

虎嗅APP 浏览 2898

2-4遭海牛逆转,国安追平队史中超主场单场丢球纪录

懂球帝 浏览 3290

德约纪念逝去恩师忍不住落泪,现场打脸意大利网协主席

网球之家 浏览 3089

《秋雪漫过的冬天》首播,不如原版韩剧好看

马庆云的影音娱 浏览 2384

29岁女白领荒野求生半月瘦成"闪电":睡觉时放一把刀

都市快报橙柿互动 浏览 14620
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1