关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11387人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

半年暴涨超470%!中际旭创,实控人拟套现22亿!

侃见财经 浏览 1473

电影《悬崖之上》票房破7亿,却让人高兴不起来

趣看热点 浏览 27252

以色列官员:预计本周批准马斯克旗下星链服务

财联社 浏览 12494

马克龙再选勒科尔尼当总理遭批,法媒:没有议会支持的总统,只会陷入更深孤立

环球网资讯 浏览 1032

下周!北约史上最大规模空演

环球网资讯 浏览 16281

因脑震荡规则,鲁本-迪亚斯无缘曼城欧超杯名单

直播吧 浏览 14288

尤文伤情更新:小基耶萨麦肯尼已能合练,拉比奥特得等到周四

直播吧 浏览 12558

天空体育:苏超流浪者与海港主帅穆斯卡特谈判已进入最后阶段

懂球帝 浏览 984

复盘瓦格纳"24小时哗变":一度称距莫斯科仅200公里

澎湃新闻 浏览 15833

成熟企业做新品牌往往很难成功,为什么?

创业家 浏览 874

净利润暴跌7912%!天域生物亏麻了

包不同 浏览 409

17岁丹麦王子约会意大利公主,王储妃妈妈很满意

译言 浏览 16671

针对高校食堂"鼠头鸭脖"事件 江西成立联合调查组调查

央视新闻客户端 浏览 91888

王传福的睡梦中,这个越南人,超了比亚迪

华商韬略 浏览 14742

雷军,这次不对劲

创业家 浏览 988

通勤党一周毛衣穿搭,get秋冬温暖氛围感!

美芽 浏览 13123

中东多国组建新联盟 美第五舰队吐出一口老血

上观新闻 浏览 16512

余承东被回旋镖打中?2023年车圈十大名梗,哪个给你的印象最深?

二师兄玩车 浏览 12402

汇丰在美国法院受挫,因“挖角硅谷银行员工并窃取商业机密”面临超10亿美元诉讼

界面新闻 浏览 12451

众星时装周路透:张嘉倪瘦脱相,刘涛低调素颜

盖饭娱乐官方号 浏览 19425

MRAM,台积电重大突破

半导体行业观察 浏览 988
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1