关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2976人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

聚焦进博|一个巴西律师的“新上海故事”

国际金融报 浏览 3098

深圳自动驾驶安全实验室揭牌成立,将重点攻坚十大方向

南方都市报 浏览 2342

普通人秋天就该这么穿,准备几件黑色单品和牛仔服饰,简约又百搭

静儿时尚达人 浏览 3307

成熟女性秋天衣服怎么穿?看看这些穿搭就有灵感,舒适又简约

静儿时尚达人 浏览 3541

今年秋天最流行的风衣,“短一点”才时髦!

LinkFashion 浏览 2687

萨拉赫还是萨卡?墨菲:萨拉赫,他总能进些不可思议的球

懂球帝 浏览 2945

《赴山海》:一集至少两个漏洞

流云天下 浏览 4163

三镇小将姜利勋:中超首秀还是有点放不开,教练一直在鼓励我

懂球帝 浏览 1515

"最快女护士"张水华风波后首次公开参赛 获女子组第二

每日经济新闻 浏览 8165

突发!技术派掌权,吴泳铭调整阿里组织结构

互联网那些事 浏览 706

波士顿动力人形机器人亮相CES 拟2028年进厂造车

网易汽车 浏览 2409

成都天府国际空港综合保税区通过验收

央视财经 浏览 2316

皇马TV显示,贝林厄姆将在国家德比中担任首发右边锋

懂球帝 浏览 3328

2025年利润在4%徘徊,车圈是从从容容还是连滚带爬‌?

禾颜阅车 浏览 2607

快看漫画多位早期投资者和高管退出,创始人曾是千万粉丝网红,行业正经历深度调整

红星资本局 浏览 2078

SpaceX:识别并切断缅甸电诈园区周边逾 2500 台“星链”设备

IT之家 浏览 3280

恭喜!49岁萧煌奇官宣结婚,和妻子晒结婚戒指分享甜蜜

素素娱乐 浏览 2185

台媒曝具俊晔放弃大S遗产,转入孩子名下

萌神木木 浏览 2161

马罗塔:国米不考虑中途换帅

体坛周报 浏览 3893

2026款捷途旅行者新增车型上市 售价19.19万

车质网 浏览 2885

稳定币监管僵局震动加密货币市场:Coinbase(COIN.US)带头反对 关键法案被迫推迟审议

智通财经 浏览 2284
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1