• 阿里终于意识到开源的价值
  • 发布于 2个月前
  • 124 热度
    0 评论
最近 DeepSeek 尤其火,但很多人可能没注意到,阿里巴巴的通义大模型在全球开发者市场领域也有相当的影响力。虽然通义大模型在 C 端市场占有率不算高,比不过豆包、Kimi 以及现在大热的 DeepSeek 这些 ChatBot 类产品,但在开源社区中反馈不错。DeepSeek 推出来之后,有不少科研人员和开发者把 Qwen 和 DeepSeek 结合起来一起使用,或者基于 Qwen 来实现 DeepSeek 的推理路径。Qwen 也有 MoE 架构,我们之前也部署过,整体感觉比 LLaMA 要好。

前天,在迪拜举行的 World Governments Summit 2025 峰会上,蔡崇信宣布了阿里巴巴与苹果达成合作的消息。到了昨天,苹果 iPhone 上的 AI 解决方案的完整思路才逐渐清晰。主要还是苹果用自己的自研模型,再结合阿里巴巴和百度的模型一起为用户提供服务,主力还是苹果自研的模型。阿里巴巴主要负责本地化 AI 处理与合规适配工作。百度正在参与开发处理图像和基于文本的 AI 搜索功能,并升级中文版 Siri 的语音指令理解、多轮对话等能力。

此外,蔡崇信还重点提到了阿里对于开源模型的理解,你应该看到了,昨天百度也宣布开源了自己的大模型。之前好多人都认为开源模型无法战胜闭源模型,但现在这种认知被啪啪打脸了。

早些年,阿里对开源不是那么虔诚,有好多像 Dubbo 这样的产品,都是虎头蛇尾。那时候我还是程序员,大家都在吐槽,阿里开源项目大部分是为 KPI 而生的。但从这次蔡崇信的发言里,可以看到,他们要动真格了,阿里管理层真正意识到了开源的价值。

下面是蔡崇信分享的对于开源模型的看法:
1、如果你把训练前沿模型看作是一种让孩子们变聪明的事业,目标是让他们变得最聪明,获得博士学位,而不仅仅是一个学科,可能是 15 个学科,也许只有五六个富有的家长能负担得起让孩子们接受这样全面的教育。

2、DeepSeek 让我们看到了开源的价值。如果今天你的人生目标是开发一个封闭源的 AI 系统,成为最聪明的博士学者,获得诺贝尔奖,我个人认为这个目标的价值接近于零。这不是我们希望生活的世界。

3、我认为有方法可以培养聪明的孩子,而不必依赖这些庞大的计算资源。如果大家能集中精力,首先,专注于应用;第二,利用开源社区、生态系统。开源社区的一个特点是人们会共享。你为开源做出的贡献现在成为了生态系统的一部分,其他人可以从中学习。

4、我们是电商业务。如果我要开发一个非常智能的购物助手来帮助推荐商品给顾客,真的需要一个有万亿参数的大语言模型吗?可能不需要。就像你在商店雇佣一个购物助手时,你是否需要让他们获得物理学博士学位才能挑选出最好的衣服?大概不需要。

5、现在有了开源,许多公司可以参与其中,他们可以将开源代码部署到自己的基础设施上,无论是大公司还是小公司,甚至创业者,现在都可以共同开发 AI ,一起贡献 AI 的力量。我认为这是创新的一件好事,而不仅仅限于五六家公司。如果这五六家公司每年在计算基础设施上投资六百到八百亿美元,那真是疯狂。
用户评论