关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4520人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

CEO们不再为了流量吹牛,挺好的

汽车公社 浏览 3891

洛里昂vs布雷斯特:姆沃戈、马肯戈首发,迪纳-埃宾贝、阿若克出战

懂球帝 浏览 4499

温州推出外卖后厨“AI 智能评价处置”系统

IT之家 浏览 5274

2025 年最强太阳耀斑爆发,引发非洲和欧洲多地无线电中断

IT之家 浏览 4226

小鹏汽车11月交付新车36,728台 1-11月累计交付391,937台

网易汽车 浏览 3881

50岁女性冬季穿衣指南:避开 2 大禁忌,这样得体又时髦

静儿时尚达人 浏览 3883

赵丽颖新剧翻车!热搜宣传是朱媛媛遗作,网友怒斥剧方吃人血馒头

萌神木木 浏览 3576

鲁媒谈准入:新赛季会带给更多球队机遇,想获红利需守住阵地

懂球帝 浏览 3779

连续三个月创历史新高 蔚来公司10月新车交付首超4万台

网易汽车 浏览 4298

李安新片《金山》停摆!好莱坞变了天

草莓解说体育 浏览 3840

近2万亿债务推进 出险房企提速化债

北京商报 浏览 4146

世界杯仅剩15天!内马尔警报:一瘸一拐离开医院 足协担忧

叶青足球世界 浏览 601

张家辉夫妻米兰吃火锅!与粉丝合影细节暖心

陌识 浏览 3412

天津外援阿代米谈胜利:现在要做的是忘掉这一场比赛,准备下一场

直播吧 浏览 5217

全运会女足综述:王霜制胜湖北2-1进4强 张琳艳世界波北京1-3上海

我爱英超 浏览 4323

娜扎《玉茗茶骨》解锁国风新体验

呱田里的猹 浏览 3470

宁波象山沿海进行军事演练 禁止驶入

极目新闻 浏览 5200

Jane Street、Citadel Securities三季度业绩强劲,全年有望创纪录

华尔街见闻官方 浏览 3868

亚马逊宣布对外开放旗下物流,美版京东物流要来了?

江瀚视野 浏览 675

破亿品牌数增长,3万品牌成交翻倍,今年双11的商业变革悄然开始

一点财经 浏览 4344

记者:詹姆斯复出后将湖人的快攻水平从倒数后5提升到正数前5

懂球帝 浏览 4059
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1