闽公网安备 35020302035485号
堆代码讯 当生成式 AI 的浪潮席卷全球,所有企业都在疯狂涌入这个赛道:训练大模型、部署 AI 应用、抢占市场…… 但在热闹的背后,一个越来越沉重的负担正在压向企业:失控的基础设施成本。GPU 大量闲置、工作负载过度配置、云账单月月暴涨,企业花出去的钱,有一大半都打了水漂。总部位于纽约的初创公司 ScaleOps,正是瞄准了这个 AI 时代的新痛点。这家公司打造的自主云基础设施管理平台,能够实时自动优化企业的计算资源分配,帮企业把云与 AI 基础设施的成本最高砍掉 80%。近日,ScaleOps 宣布完成了 1.3 亿美元的 C 轮融资,估值达到 8 亿美元,成为云成本管理赛道的最新明星玩家。
对于正在布局 AI 的企业而言,资源浪费已经成为了一个公开的秘密。为了跑 AI 工作负载,企业往往会采购大量的 GPU、配置海量的云资源,但为了应对突发的流量峰值,大部分团队都会选择 “过度配置” 资源 —— 毕竟,没人敢承担 AI 应用卡顿、停机的风险。但这就导致了一个尴尬的结果:大部分时间里,这些昂贵的 GPU、计算资源,都在闲置。据行业统计,很多企业的 GPU 利用率甚至不到 30%,剩下的 70% 的成本,全都打了水漂。而随着 AI 工作负载越来越动态、越来越复杂,传统的管理方式,已经完全跟不上了。
“那些 DevOps 团队,虽然喜欢 Run:ai 的功能,但他们还是管不好生产环境的工作负载,尤其是 AI 时代,推理工作负载越来越普遍,”Shafrir 说。“我后来发现,这个问题根本不只是 GPU 的问题,它延伸到了计算、内存、存储、网络的方方面面 —— 团队就是没办法有效管理这些动态的资源。”
ScaleOps 的解决方案,就是打造一个全自主、上下文感知的资源管理平台,彻底把 DevOps 团队从手动调配置的工作里解放出来。这个平台能够实时理解每个应用的上下文:它需要什么资源、它是怎么运行的、环境在怎么变化,然后自动、实时地调整资源的分配,不用任何人手动配置。和传统的静态配置不同,ScaleOps 的系统能够跟着应用的需求动态变化,峰值的时候自动加资源,闲的时候自动减资源,既保证了性能,又不会浪费钱。
这也是为什么 ScaleOps 能帮企业把成本最高砍掉 80%—— 对于 AI 工作负载来说,光是 GPU 的成本,就能直接降低 50% 以上。和赛道里的竞争对手比如 Cast AI、Kubecost、Spot 不同,ScaleOps 从一开始就是为生产环境打造的。很多竞争对手的自动化工具,因为缺乏全局的把控,很容易导致性能问题甚至停机,企业根本不敢用在核心的生产环境。但 ScaleOps 的平台,能够全局把控整个集群的状态,在优化成本的同时,完全不会影响应用的性能和稳定性,这也让它获得了大量大企业的信任。
目前,ScaleOps 已经服务了全球的大量企业客户,其中就包括 Adobe、DocuSign、Salesforce、Wiz 这些行业巨头,客户覆盖了大型组织,以及欧洲、印度等全球市场的企业,所有这些客户,都在用 ScaleOps 管理他们基于 Kubernetes 的核心基础设施。
近日,ScaleOps 正式宣布完成了 1.3 亿美元的 C 轮融资,本轮融资由 Insight Partners 领投,Lightspeed Venture Partners、NFX 等现有投资者跟投,估值达到了 8 亿美元。这距离他们上一轮 5800 万美元的 B 轮融资,仅仅过去了一年半的时间。而这一年半里,ScaleOps 的增长堪称疯狂:公司的年同比增长率超过了 450%,过去 12 个月里,员工人数直接翻了三倍,并且计划到 2026 年底,再翻三倍以上。
截至目前,公司的总融资额已经达到了约 2.1 亿美元。这样的增长,也刚好印证了市场的需求有多旺盛。随着 AI 的爆发,企业对计算资源的需求正在暴涨,云厂商的资本开支已经开始激增,2026 年头部云厂商的资本开支预计会增长 40%,达到 5300 亿美元。但对于企业来说,如何把这些资源的效率用到极致,如何把成本降下来,已经成为了比 “拿到资源” 更重要的事。