• DeepSeek R1 模型更新,实测能力更强
  • 发布于 1周前
  • 149 热度
    0 评论

昨天,DeepSeek 官方推送通知,称 R1 模型已经完成小版本试升级。目前在官方网站、APP、小程序测试(打开深度思考)就能体验。据悉,本次更新的版本名为「DeepSeek-R1-0528」,该模型具有 685B 规模,支持「BF16」,目前已上架 HuggingFace。这次更新很有可能已经用上了 3 月发布的 DeepSeek-V3-0324 模型,编程能力大大提升。


另据 LiveCodeBench 基准测试显示,DeepSeek-R1-0528 在多项测试中接近 OpenAI 的 o4-Mini 和 o3,部分测试超越了 o3-Mini。
我们也在第一时间进行了实测,并用之前体验 Claude3.7 的一个 prompt(提示词)来测试:
「做一个带有动画效果的天气卡片,要求是使用 HTML、CSS 和基础 JavaScript,实现时间和天气信息的动态更新。」
大概十几秒就跑出来了,发现效果比之前好了不少,设计细节和交互动画都很在线。因此可以推断这次更新后 R1 编程能力有了明显增强,甚至可能可以跟刚发布的编程新王 Claude 4 一较高下。
我们后续还会继续测试 R1 这次还有哪些更新,也欢迎大家分享自己的实测体验,一起挖出更多有意思的功能更新。
附上 DeepSeek R1 新版模型的 HuggingFace 链接:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
用户评论