IT之家 6 月 20 日消息,@Designarena 今天(6 月 20 日)在 X 平台发布推文,宣布在 Design Arena 单轮 HTML 网页设计(非智能体)评测中,智谱的 GLM-5.2 模型超过 Claude Fable 5 等模型,首次登顶总分第一。
IT之家查询公开资料,Design Arena 是全球首个通过群众外包(Crowdsourced)盲测,来评估 AI 生成设计质量的基准测试平台。在目前的 AI 评测界,Design Arena 被公认为最具行业说服力的“审美和落地设计”风向标之一。
根据最新 Design Arena 榜单,GLM 5.2 超越 Claude Fable 5、Opus 4.6 和 Opus 4.7 登顶但,比其前代 GLM 5.1 提升 5 个名次。GLM 5.2 每百万 tokens 的推理价格为 1.40/4.40 美元,远低于 Fable 5 的 10/50 美元,在性价比上占据绝对优势。
Design Arena 指出 GLM 5.2 能高效调用 chart.js、three.js 等第三方库,让使用这些库的会话胜率提升 6.0 个百分点。此外,它在 91% 的会话中使用 TailwindCSS,在 51% 中使用 font-awesome,通过精心设计交互提升胜率 1.2 个百分点。相比之下,Fable 5 仅在 57% 的会话中使用 TailwindCSS,可能因此导致性能下降。
Design Arena 还指出 GLM 5.2 显著提升布局能力,擅长使用外部 CDN 图片构建网页,并在排版、视觉布局和动画方面表现出色。