智谱GLM-5开源发布：744B参数MoE模型，编程能力逼近顶尖闭源模型

迪滴

1个月前发布

0426

智谱AI近期开源了GLM-5系列模型，这是目前中文AI领域最受关注的开源发布之一。GLM-5采用了744B参数的混合专家（MoE）架构，在多项编程基准测试中取得了接近顶尖闭源模型的成绩。

模型规格

GLM-5系列的关键参数：

总参数量：744B（7440亿）
架构：MoE（混合专家），激活参数量远小于总参数量
编程能力：SWE-bench得分77.8，接近Claude和GPT-4的水平
开源协议：开放权重，允许商用

SWE-bench是目前最权威的编程能力评测基准之一，它测试模型解决真实GitHub issue的能力。77.8分意味着GLM-5在实际编程任务上的表现已经非常接近商业闭源模型。

为什么重要

GLM-5的开源意味着：

自建AI编程助手成为可能：站长和开发者可以在自己的服务器上部署GLM-5，构建私有的AI编程助手，不依赖第三方API。
成本优势：自建部署的长期成本可能远低于按token付费的API调用，特别是对于高频使用场景。
数据安全：代码不会发送到外部服务器，对于有安全要求的企业和团队来说是重要优势。
中文能力：作为中文AI公司的产品，GLM-5在中文理解和生成方面有天然优势。

部署建议

对于想尝试GLM-5的站长和开发者：

硬件要求：744B参数的MoE模型需要大量GPU显存。即使使用量化技术，也需要多张高端GPU。建议使用云GPU服务或等待官方提供的轻量版本。
推理框架：推荐使用vLLM或TensorRT-LLM等推理框架来优化性能。
量化方案：如果显存不足，可以尝试GPTQ或AWQ量化版本，在精度和性能之间取得平衡。
API替代：如果不想自建，智谱也提供API服务，价格相比国际竞品有一定优势。

与同类模型对比

目前开源编程能力强的模型主要包括：

GLM-5（智谱）：744B MoE，SWE-bench 77.8，中文能力强
DeepSeek V4（深度求索）：专注于推理和编程，在中文开发者中口碑很好
Qwen-3.5（阿里）：通义千问系列，生态完善，与阿里云深度整合
Llama 4（Meta）：英文能力突出，社区生态最大

选择哪个模型取决于具体需求：如果重视中文能力和本地化，GLM-5和Qwen-3.5是不错的选择；如果重视社区生态和工具链，Llama 4更成熟。

简评

GLM-5的开源发布再次证明了一个趋势：开源模型与闭源模型的差距正在快速缩小。对于站长来说，这意味着自建AI服务的门槛在降低，选择在增多。即使暂时无法部署如此大的模型，也可以关注后续的蒸馏版本和量化方案——历史经验告诉我们，大模型的能力会很快”下沉”到更小、更实用的版本中。

本文参考来源：
掘金：智谱GLM-5这次开源，让高级程序员也危险了
 GitHub: THUDM

文章版权声明 1、本网站名称：枫选
2、本站永久网址：https://feng.cx
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END