昨晚,智谱正式发布最新旗舰模型 GLM-4.5。按照智谱官方说法,这是一款专为 Agent 应用打造的基础模型。具体来看,GLM-4.5 采用混合专家(MoE)架构,3550 亿总参数/320 亿激活参数;另外还有一个轻量化一点的版本——GLM-4.5-Air:总参数量 1060 亿,激活参数为 120 亿。
性能表现上,GLM-4.5 在推理、代码、智能体综合能力达到开源模型 SOTA 水平。结果综合平均分,GLM-4.5 交出了一份全球模型第三、国产模型第一、开源模型第一的成绩单。
此外,GLM-4.5 在成本和效率上的突破可能更具杀伤力。API 调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens,同时,高速版本实测生成速度最高可至 100 tokens/秒,支持低延迟、高并发的实际部署需求。