GLM-5.1 获 Artificial Analysis 全新 Coding Agent 基准开源第一
今日,全球权威评测机构 Artificial Analysis 发布全新 Coding Agent 基准 Artificial Analysis Coding Agent Index,用于衡量 Agent harnesses 与模型的组合在 SWE-Bench-Pro-Hard-AA、Terminal-Bench v2 和 SWE-Atlas-QnA 主流基准上的表现。其中,闭源模型 Opus 4.7(在 Cursor CLI 中运行)全球第一,GLM-5.1(在 Claude Code 中运行)取得开源第一。
 
 
Back to Top