关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西422人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

预售21.99万元起,蔚来旗下乐道L60银色实车曝光

IT之家 浏览 11110

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 11730

大国之间首先动用的武器?五角大楼想借它压制中俄

环球军事时报 浏览 25662

秦煌如今过成这样只能算他活该?

一针见娱 浏览 1044

15年离婚拉锯落幕,“中国巴菲特”失去沃华医药实控权

野马财经 浏览 706

市监总局:规范新能源汽车检测收费 严查违法行为

中国经济网 浏览 20047

夫妻徒步回家过年:58天2千公里跨3省1市 睡过桥洞牛棚

上游新闻 浏览 79693

《浪姐》观众的讨伐,谢娜的虚假好人缘早被撕开了

传媒一班 浏览 16869

高市暗藏意图:引入核武器 获取打击中国腹地能力

国际在线 浏览 12886

是时候考虑购买美国大豆了,为了“拴住”特朗普!

北向财经 浏览 780

伯恩利官方:同曼城一役向场内投掷物品的球迷将受到长期禁赛

直播吧 浏览 14173

王家卫持续被扒

萌神木木 浏览 718

赵少康为何不参选国民党主席 陈文茜:他怕妻女怕得要死

海峡导报社 浏览 5916

华为星闪起猛了!蓝牙技术全面应战,还针对中国市场出招

雷科技 浏览 722

北向资金三季度持仓曝光:宁德市值第一,京东方A获增持股数最多

澎湃新闻 浏览 985

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 208

大连有梅花鹿连续2天攻击游客 受伤女子:我没招惹它

极目新闻 浏览 19422

赵薇素颜现身哈尔滨游玩 近照发胖浮肿变成"直桶腰"

我娱乐有约 浏览 78354

立陶宛称中国有可能干涉立陶宛大选 外交部:没有兴趣

外交部网站 浏览 82675

“私拆承重墙”通报:房东物业从重按上限处罚!248套房均未发现结构构件受力裂缝,修复后可满足安全使用要求

每日经济新闻 浏览 16684

一天跌20%,怎么避开这类大坑

简七理财 浏览 10927
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1