三年前,当乔·菲奥蒂还在英特尔从事芯片设计时,这位如今的Luminal联合创始人已意识到一个问题:即便能打造出最顶尖的芯片,真正的瓶颈却潜藏在软件层面。他向我坦言:“你可以做出全世界最出色的硬件,但如果开发者觉得难以使用,他们根本不会采纳。”

现在,他创立的公司正全力应对这一挑战。本周一,Luminal正式宣布获得530万美元种子轮融资。本轮融资由富利资本领投,保罗·格雷厄姆、吉列尔莫·劳奇和本·波特菲尔德等天使投资人也参与了投资。菲奥蒂的联合创始人杰克·史蒂文斯与马修·冈顿分别来自苹果和亚马逊。该公司还成功入选了YC创业营2025年夏季批次。
Luminal的核心业务与Coreweave、Lambda Labs等新兴云服务商类似,该公司主要提供算力租赁服务。不过,在其他公司专注于GPU规模时,Luminal另辟蹊径,致力于通过优化技术从现有基础设施中挖掘更多的算力潜力。公司特别专注于优化介于代码与GPU硬件之间的编译器系统——这也正是菲奥蒂在之前工作中最为头疼的技术环节。
目前,业界领先的编译器当属英伟达的CUDA系统。这个常被低估的关键要素,正是英伟达能够势如破竹取得成功的重要原因。随着CUDA多数组件已开源,Luminal坚信,在AI行业仍在争抢GPU的当下,完善技术栈的其他环节将创造巨大价值。随着各企业都在寻求更快速、更经济的模型运行方案,专注于推理优化的初创公司正迎来价值认可。Luminal正是这批新兴企业中的一员。像Baseten和Together AI这样的推理服务商长期专注于优化技术,而Tensormesh、Clarifai等规模较小的公司也凭借更精细的技术方案开始崭露头角。
尽管Luminal及其同行将面临来自大型实验室优化团队的激烈竞争——这些团队拥有为特定模型系列进行专门优化的优势,而Luminal则需要适应客户可能提出的各种模型——但菲奥蒂表示,即便面临被行业巨头碾压的风险,快速扩张的市场规模依然让他充满信心。
菲奥蒂分析道:“如果愿意花半年时间针对特定硬件手动调整模型架构,你确实有可能超越任何编译器的性能表现。但我们的核心判断是:在非极致优化的大多数场景下,通用解决方案仍然具有显著的经济价值。”