• Kimi K2超越DeepSeek R1,拿下开源模型第一名
  • 发布于 17小时前
  • 10 热度
    0 评论
  • 风尘客
  • 1 粉丝 45 篇博客
  •   

昨日,权威大模型排行榜 LMArena 公布了最新排名结果,近期发布的 Kimi K2 超越 DeepSeek R1,拿下了开源模型第一名。LMArena 表示,Kimi K2 凭借自身性能以及 3000 的社区投票,在 LMArena 总排行榜上获得第五名的位置。

值得一提的是,Kimi K2 和 DeepSeek R1 为 LMArena 排行榜前十中,两个来自中国的模型;但在全球前 20 名中,来自中国的模型扩展到 7 个,MiniMax M1、Qwen3-235b 等模型均有上榜。Kimi-K2 于上周发布并开源,号称「具备超强代码和 Agent 能力的 MoE 架构基础模型」。官方介绍,K2 总参数达到 1T,激活参数为 32B,上下文长度为 128k,并且支持 ToolCalls、联网搜索功能等。


据悉,在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。另外,针对「Kimi K2 采用了 DeepSeek V3 架构」的质疑,Kimi K2 开发成员刘少伟日前在知乎进行了回答。其表示「确实继承了 DeepSeek V3 的结构,但调整适合 Kimi 模型的结构参数」。并且其透露,V3 架构符合开发相关成本预算,因此选择了完全继承 V3 架构。
用户评论