爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

美拉德+黑蓝...

苹果CEO库...

乌方呼吁美国...

急诊救命、省...

贝莱林：温格...

多省份公布金...

为打造本地生活超级入口高德再推新招提升平台活跃度

上海双雄克星！艾曼3战独造5球，助攻双响后被队友“擦鞋”

OpenAI：人类打字速度将成通用人工智能发展瓶颈

AI眼镜厂商，正在集体拒交“智商税”

助力识别、延缓或逆转老年疾病，全新“自然奖项”问世

勇士124-106轻取鹈鹕，库里11中2仅9分，穆迪8记三分

凑齐“56789”！问界独占鸿蒙智行7成销量，“5界”如何共扛百万辆目标？

广州一变电站迎来全球首发机器人：可全向移动、双臂协作

吸职工血、吞救命钱，42岁的她如今沦为过街老鼠

上海81岁外公卖房还债租房照顾2个未成年外籍外孙女

坏了，看到剧本杀鼻祖了！

支付宝下架首页AQ广告，回应“内斗”传闻，网友：感觉就是一场营销

媒体：欧盟触碰伊朗＂红线＂伊朗对欧洲的批评很醒目

达姆施塔特工业大学发布SCICOQA数据集

11国将承认巴勒斯坦国之际美国追加60亿美元对以军售

荷兰被中美欧同时施压急疯高官致电北京恳请解决问题

9.4分剧王回归，封神到最后一秒

涉及巨额采购协议印度纠结引进何种隐形战斗机

《再见爱人5》收官，评论区被骂翻

艾弗森怒斥轮休：让我轮休？那xx是一场比赛，有种训练也让我休息好了

鲁本-迪亚斯：经验告诉我们，如果不在最佳状态就无法夺冠

韩红父亲居然是他？这身份太惊人了

边打字边出片，交互式生成长视频！英伟达联合MIT开源新SOTA

廷贝尔：联赛杯决赛也许能成为争冠动力；哈弗茨不是安静的人