关闭广告

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者3151人阅读


当我们训练人工智能写代码或解数学题时,就像教小孩做作业一样,需要给它很多练习题。但问题来了:有些题目太简单,AI一下就会了;有些题目太难,AI怎么也学不会。更麻烦的是,按照传统方法,不管题目难易,我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间,也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队,在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器",让它能够根据题目难度自动分配练习时间,既不浪费计算资源,又能确保每道题都学得扎实。

研究团队的核心发现是:当前主流的AI训练方法GRPO(组相对策略优化)存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时(要么全对要么全错),系统就收不到有用的学习信号,就像老师看到学生交上来的作业要么全是满分要么全是零分,无法判断学生的真实水平。

为了解决这个问

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曼晚:无论卡里克成绩如何,恩里克、纳格尔斯曼顺位在他前面

懂球帝 浏览 1480

内娱清流!这4位女星从不拍“吻戏”

喜欢历史的阿繁 浏览 3826

U23亚洲杯身价榜:中国第三力压日韩,沙特居首伊朗次席

懂球帝 浏览 2356

罗永浩炮轰电信宽带缩水:再不解决,就要在网上发疯了

观察者网 浏览 2660

入秋第一条裤子就买它!时髦显瘦,巨好看!

Yuki女人故事 浏览 4026

股价“闪崩”、市值蒸发500亿,寒武纪怎么了?

征探财经 浏览 2062

委总统要求保留军权 遭特朗普拒绝

新华社 浏览 2783

前三季度增利不增收,三全食品错失预制菜风口后押注肉制品

时代周报 浏览 3229

于文文贵州演唱会晕倒,曝被救护车拉走,连轴演出引粉丝担忧

扒虾侃娱 浏览 2037

胜利就是最佳礼物,B费:为曼联出战300场最好的庆祝方式

懂球帝 浏览 2703

充电十分钟、续航2000公里!宁德时代宣布:2027年量产全固态电池

优视汽车 浏览 2861

乘联分会崔东树:2025年汽车以旧换新规模预计超1800亿元

IT之家 浏览 2773

乌军袭击一生产弹道导弹的俄军工厂

每日经济新闻 浏览 1654

上海AI实验室ImgCoder:AI实现科学手绘图精准生成

科技行者 浏览 2207

AI时代,寻找超级创业者!徐汇区发布政策扶持一个人赛过一群人的“大牛”

上观新闻 浏览 2033

Aluminium OS曝光:谷歌安卓、ChromeOS统一桌面平台计划加速落实

IT之家 浏览 2905

女人过了60岁也别放弃变美!冬季看看这些穿搭,得体又大方

静儿时尚达人 浏览 2686

曝英特尔、AMD已售出今年大部分服务器CPU产能,考虑Q1涨价

IT之家 浏览 2200

今年电动汽车销量将创六年来最慢增速

大象新闻 浏览 2376

300353,重大资产重组!明日复牌

中国基金报 浏览 3089

《麻省理工科技评论》发布2026年“十大突破性技术”

DeepTech深科技 浏览 2297
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1