关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11387人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

半年暴涨超470%！中际旭创，实控人拟套现22亿！

侃见财经浏览 1473

电影《悬崖之上》票房破7亿，却让人高兴不起来

趣看热点浏览 27252

以色列官员：预计本周批准马斯克旗下星链服务

财联社浏览 12494

马克龙再选勒科尔尼当总理遭批，法媒：没有议会支持的总统，只会陷入更深孤立

环球网资讯浏览 1032

下周！北约史上最大规模空演

环球网资讯浏览 16281

因脑震荡规则，鲁本-迪亚斯无缘曼城欧超杯名单

直播吧浏览 14288

尤文伤情更新：小基耶萨麦肯尼已能合练，拉比奥特得等到周四

直播吧浏览 12558

天空体育：苏超流浪者与海港主帅穆斯卡特谈判已进入最后阶段

懂球帝浏览 984

复盘瓦格纳＂24小时哗变＂:一度称距莫斯科仅200公里

澎湃新闻浏览 15833

成熟企业做新品牌往往很难成功，为什么？

创业家浏览 874

净利润暴跌7912%！天域生物亏麻了

包不同浏览 409

17岁丹麦王子约会意大利公主，王储妃妈妈很满意

译言浏览 16671

针对高校食堂＂鼠头鸭脖＂事件江西成立联合调查组调查

央视新闻客户端浏览 91888

王传福的睡梦中，这个越南人，超了比亚迪

华商韬略浏览 14742

雷军，这次不对劲

创业家浏览 988

通勤党一周毛衣穿搭，get秋冬温暖氛围感！

美芽浏览 13123

中东多国组建新联盟美第五舰队吐出一口老血

上观新闻浏览 16512

余承东被回旋镖打中？2023年车圈十大名梗，哪个给你的印象最深？

二师兄玩车浏览 12402

汇丰在美国法院受挫，因“挖角硅谷银行员工并窃取商业机密”面临超10亿美元诉讼

界面新闻浏览 12451

众星时装周路透：张嘉倪瘦脱相，刘涛低调素颜

盖饭娱乐官方号浏览 19425

MRAM，台积电重大突破

半导体行业观察浏览 988

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

YouTub...

2.9T V...

马德兴：国足...

网红拍不雅视...

AMD为RX...

交通标志设置...

普京即将访印之际印俄敲定价值20亿美元核动力潜艇租赁协议

会穿搭的女人更有气质，春季背熟这些公式，年过四十也时尚好看

中美达成共识让美豆农松口气盼望中方订单快点来

半年暴涨超470%！中际旭创，实控人拟套现22亿！

电影《悬崖之上》票房破7亿，却让人高兴不起来

以色列官员：预计本周批准马斯克旗下星链服务

马克龙再选勒科尔尼当总理遭批，法媒：没有议会支持的总统，只会陷入更深孤立

下周！北约史上最大规模空演

因脑震荡规则，鲁本-迪亚斯无缘曼城欧超杯名单

尤文伤情更新：小基耶萨麦肯尼已能合练，拉比奥特得等到周四

天空体育：苏超流浪者与海港主帅穆斯卡特谈判已进入最后阶段

复盘瓦格纳＂24小时哗变＂:一度称距莫斯科仅200公里

成熟企业做新品牌往往很难成功，为什么？

净利润暴跌7912%！天域生物亏麻了

17岁丹麦王子约会意大利公主，王储妃妈妈很满意

针对高校食堂＂鼠头鸭脖＂事件江西成立联合调查组调查

王传福的睡梦中，这个越南人，超了比亚迪

雷军，这次不对劲

通勤党一周毛衣穿搭，get秋冬温暖氛围感！

中东多国组建新联盟美第五舰队吐出一口老血

余承东被回旋镖打中？2023年车圈十大名梗，哪个给你的印象最深？

汇丰在美国法院受挫，因“挖角硅谷银行员工并窃取商业机密”面临超10亿美元诉讼

众星时装周路透：张嘉倪瘦脱相，刘涛低调素颜

MRAM，台积电重大突破

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

YouTub...

2.9T V...

马德兴：国足...

网红拍不雅视...

AMD为RX...

交通标志设置...

普京即将访印之际 印俄敲定价值20亿美元核动力潜艇租赁协议

会穿搭的女人更有气质，春季背熟这些公式，年过四十也时尚好看

中美达成共识让美豆农松口气 盼望中方订单快点来

半年暴涨超470%！中际旭创，实控人拟套现22亿！

电影《悬崖之上》票房破7亿，却让人高兴不起来

以色列官员：预计本周批准马斯克旗下星链服务

马克龙再选勒科尔尼当总理遭批，法媒：没有议会支持的总统，只会陷入更深孤立

下周！北约史上最大规模空演

因脑震荡规则，鲁本-迪亚斯无缘曼城欧超杯名单

尤文伤情更新：小基耶萨麦肯尼已能合练，拉比奥特得等到周四

天空体育：苏超流浪者与海港主帅穆斯卡特谈判已进入最后阶段

复盘瓦格纳＂24小时哗变＂:一度称距莫斯科仅200公里

成熟企业做新品牌往往很难成功，为什么？

净利润暴跌7912%！天域生物亏麻了

17岁丹麦王子约会意大利公主，王储妃妈妈很满意

针对高校食堂＂鼠头鸭脖＂事件 江西成立联合调查组调查

王传福的睡梦中，这个越南人，超了比亚迪

雷军，这次不对劲

通勤党一周毛衣穿搭，get秋冬温暖氛围感！

中东多国组建新联盟 美第五舰队吐出一口老血

余承东被回旋镖打中？2023年车圈十大名梗，哪个给你的印象最深？

汇丰在美国法院受挫，因“挖角硅谷银行员工并窃取商业机密”面临超10亿美元诉讼

众星时装周路透：张嘉倪瘦脱相，刘涛低调素颜

MRAM，台积电重大突破

普京即将访印之际印俄敲定价值20亿美元核动力潜艇租赁协议

中美达成共识让美豆农松口气盼望中方订单快点来

针对高校食堂＂鼠头鸭脖＂事件江西成立联合调查组调查

中东多国组建新联盟美第五舰队吐出一口老血