大家都知道我对 OpenAI 的产品、商业模式和可持续性一直持怀疑态度。虽然不想重述之前的观点,但我必须再次强调,生成式 AI 目前看来并没有展现出像云计算和智能手机那样的广泛市场应用潜力,而且它的构建和运行成本高得惊人。这两个因素引发了人们关于 OpenAI 能否中长期生存的质疑,尤其是当资金和云计算信用额度枯竭时。
我没有答案。我并不了解生成式 AI 各个方面的所有细节。我既不是工程师也不是经济学家,也没有特权信息。但是,我有能力阅读公开的数据,并评估受人尊敬的记者的独立报道以及消息灵通的专家和学者的意见,从而得出结论。
如果 OpenAI 想两年之后仍然存活,那么它必须(不分先后):
1.成功处理与微软复杂的关系,OpenAI 既要依靠微软,又和微软竞争。
2.以破纪录的速度筹集破纪录的资金。
3.实现重大技术突破,从而大幅降低构建和运营 GPT(或其后继模型)的成本。
4.有了重大技术突破后,使 GPT 能够应对目前任何 AI 研究人员都认为不可能的全新用例。
5.这些用例能够创造新工作并完全自动化现有工作,从而证明继续进行大规模资本支出和基础设施投资是合理的。
最后我认为,OpenAI 在其现有形式下是不可能成功的。没有盈利方式,烧钱速度太快,而生成式 AI 作为一项技术需要的能源超出了电网的承受能力,训练这些模型同样不可行,因为既有持续的法律问题(盗版问题)也有开发所需的训练数据量问题。而且,简单地说,任何需要数千亿美元来证明自己的技术都是建立在糟糕的架构上的。OpenAI 需要做的事情在历史上是没有先例的。从来没有人筹集过像它所需的这么多资金,也没有任何技术需要如此惊人的金融和系统力量 —— 例如重建美国电网 —— 才能生存,更不用说证明自己是值得如此投资的技术了。
强调一下,这篇文章说的是 OpenAI,不是生成式 AI 技术 —— 尽管我相信 OpenAI 的持续存在对于让公司对这个行业感兴趣/投资非常重要。OpenAI 是所有生成式 AI 公司中筹集资金最多的(高达 113 亿美元),也是最受媒体关注的,并且它推广和创建了 LLM 商业模式,推动了 “AI 驱动” 的初创公司的出现。
我不是说 OpenAI 一定会崩溃,也不是说生成式 AI 肯定会失败。我只是为了说明我认为科技生态系统中存在深层的不稳定性,冷静地解释为什么 OpenAI 在现有形式下,如果没有一系列惊人的技术突破和巨量资金投入,未来几年将无法生存下去。让我们来看看,好吗?
一.微软(和估值)问题
我已经注意到,OpenAI 和微软并没有公开披露它们交易的条款,可能有一些我不知道的事情会改变这个情况。不管怎样,OpenAI 与微软的关系非常奇怪,从 2019 年的 10 亿美元现金注入开始,被称为 “多年独家计算合作伙伴关系”,将 OpenAI 的现有服务移植到 Azure 上,并使微软成为 “OpenAI 的首选合作伙伴”。时任 OpenAI CTO 的 Greg Brockman 当时补充说,这是一项 “现金投资”,但他指出 OpenAI 计划成为 Azure 的大客户。
需要特别注意的是,Brockman 表示微软将获得销售基于 [OpenAI 研究] 的 OpenAI 的 pre-AGI 产品的访问权限给微软的客户,并在随后的博客文章中补充说,微软和 OpenAI 正在 “联合开发新的 Azure AI 超级计算技术”。这儿所说的 pre-AGI 指的是 OpenAI 曾开发的任何产品,因为它还没有开发出 AGI,还没有超越自己五级评估系统中的初始 “聊天机器人” 阶段。
实际上,这轮融资的条款包括 OpenAI 将其所做的研究交给微软,以及微软可以以 Azure 名义销售 OpenAI 的技术。此外,微软可以访问 OpenAI 的 “pre-AGI 产品研究”,这意味着微软能够看到其工作原理,这将使微软既可以销售该技术又可以直接与之竞争。
这是微软已经在做的事情,The Information 在 5 月报道,微软正在准备自己的 “MAI-1” 生成模型,该模型由 Deepmind(2014 年被谷歌收购)联合创始人 Mustafa Suleyman 运营,他在 2022 年离开 Deepmind 成为 VC。Suleyman 后来创立了 Inflection,一家基于 Transformer 的聊天机器人公司,3 月被微软收购,微软在收购之前就已经投资过 Inflection。
The Information 还提到,与 OpenAI 的合作 “帮助微软领先于其竞争对手”。我再次假设,仅这笔交易的条款就非常令人担忧。事情现在变得有点乱。
在 2023 年关于 OpenAI 的融资中提到 2021 年微软就对 OpenAI 进行了某种投资,令人困惑的是,我找不到有关这一轮融资的其他细节。Crunchbase 引用了 2021 年二级市场发行的未公开金额(意味着当时的 OpenAI 股东可以出售他们的股票),并说明这笔钱来自 Tiger Global Management、红杉资本、Bedrock 和 Andreessen Horowitz,对该公司的估值为 140 亿美元。
目前尚不清楚这是否是同一轮融资,或者微软是否以其他方式注入了资金。The Information 在 2023 年初的一篇文章中提到过,但不知道为什么,当时没人报道。不管怎样,在 2023 年初,微软对 OpenAI 投资了 100 亿美元 —— 但这笔交易最重要的部分是其条款和分配。尽管交易条款没有公开,但报道称微软将可能获得 OpenAI 利润的 75%,直到其 “收回投资”(直白的说就是收回投资的 100 亿美元),以及公司 49% 的股份,尽管 OpenAI 复杂的非营利和营利结构本身就很奇怪。
Semafor 报道称,截至 2023 年 11 月,OpenAI 仅收到 100 亿美元投资的 “一小部分”,这些投资是分阶段(tranches)交付的,而且其中 “相当一部分” 是云计算信用额度,这意味着微软的投资主要是 OpenAI 只能用于其服务的信用额度。对于那些不完全了解这种情况有多奇怪的人来说,这就像航空公司投资一家公司,但不是提供现金,而是提供飞行里程。你仍然可以旅行,但你被锁定在①一家航空公司和②他们对 “里程” 实际价值的解释上。
此外,这种 “投资” 也可能 —— 再次强调,我们不知道交易的条款 —— 允许 OpenAI 在此过程中提高其估值。Semafor 还模糊地补充说,微软拥有 “对 OpenAI 知识产权的某些权利”,即使关系破裂,微软 “仍然能够在 [其] 服务器上运行 OpenAI 的当前模型”。令人困惑的是,多名记者称微软已经向 OpenAI 投资了 “130 亿美元”,但我找不到那 20 亿美元的报道。是在 2021 年吗?金额是 20 亿美元吗?是现金还是信用额度?这个数字已经被报道了这么久,奇怪的是,很多人认为存在这 20 亿美元。
我之所以有疑问,是因为 20 亿美元对于任何一家初创公司来说都是一笔巨款。例如,Snowflake,是一家很成功的云计算公司,筹集了总共 20 亿美元,主要是在上市之前(尽管在 2022 年 IPO 后出售了 6.215 亿美元的股票)。此外,Snowflake 上季度亏损了 3.16 亿美元。
除此之外,这笔交易完全没有宣布和报道,发生在 2021 年,微软和 OpenAI 宣布其 Azure OpenAI 服务的同一年(直到 2023 年才公开推出)。虽然我在猜测 —— 如果我错了,请给我发邮件 —— 似乎微软在 2021 年再次向 OpenAI 注入了 20 亿美元,同时,OpenAI 从其他渠道筹集了一笔未公开金额的资金。我假设这笔交易可能是现金和云信用额度的混合的,尽管 ChatGPT 直到 2022 年 11 月才面世。
也有可能报道微软投入 “130 亿美元” 的人搞错了,但这是一个很简单的错误,可能会很快被微软或 OpenAI 反驳。
我之所以提出这些问题,是因为微软目前实际上已经控制了 OpenAI。微软 CEO Satya Nadella 在 2023 年 11 月 Altman 被解雇后,促成了他的回归,并计划如果 Altman 不能回归 OpenAI 就把他招到微软来。在很多方面,这并不重要。由于微软与 OpenAI 的交易性质,微软实际上拥有 —— 或至少拥有对 OpenAI 产品背后的所有知识产权的访问权,以及所有研究,并可以随意授权。
OpenAI 与微软有着千丝万缕的联系。根据协议以及大部分资金是只能用于微软 Azure 的信用额度的事实,它被迫使用微软的 Azure 云计算平台。微软通过 Azure 销售对 GPT 的访问权限,同时也通过其即将推出的模型直接与 GPT 竞争,并获得 OpenAI 服务可能产生的任何(理论上)的利润的四分之三。
实际上,在这些交易中,微软没有牺牲任何东西。即使我们假设之前所有融资 —— 理论上的 30 亿美元 —— 都是现金,并且假设 2023 年交易的 25% 是现金而不是信用额度,这也只有 55 亿美元,后半部分将在不确定的时间内分批交付。假设(再次说明,我没有确切的条款)这真的是 55 亿美元的现金,对微软来说也是微不足道的,微软在最近一个财季的利润超过 210 亿美元。
作为这笔交易的一部分,微软实际上购买了 OpenAI 的 “pre-AGI” 技术的权利,并以一种超越任何合作伙伴关系或我想象中的未来交易的方式许可其所有技术。微软还以不确定的估值 “投资” 了云计算信用额度,无论是在 OpenAI 的估值还是信用额度本身。
你自己想想,“云计算信用额度” 中的一美元值多少钱,它能给你带来什么?微软的 Azure 云有许多产品,不清楚 OpenAI 是否会在这些产品上获得优惠价格,他们将使用哪些产品,以及 OpenAI 获得这些产品的条款。微软实际上是创造了自己的货币来投资 OpenAI,OpenAI 将其支付给微软,微软则从中获得收入。
从很多方面来看,OpenAI 是作为微软生成 AI 业务部门的研发机构而存在的。如果 OpenAI 倒闭了,OpenAI 的技术仍将在微软的服务器上运行,微软仍然可以访问 OpenAI 的知识产权和产品,并能够出售它们。在 OpenAI 繁荣且未来几代 GPT 变得更成功并且利润丰厚的情况下,微软将收获数十亿美元的利润,同时仍然保留访问和许可用于实现这一目标的任何研究或产品的权利。即使是微软 1000 亿美元的超级计算机项目,据 The Information 报道,也与 Altman 和 OpenAI “显著改善” 其 AI 能力相关。
这一点我没办法证实,但你不认为 “pre-AGI” 技术和研究包括最近宣布的 OpenAI 的 SearchGPT 吗?是否值得考虑一下,无论 OpenAI 是生是死,微软都能从中受益?这是一笔魔鬼的交易,只有在你烧钱如此之多以至于有必要找一个腰缠万贯,可以在你每年耗费数十亿美元时多次救济你的人时,才会做出这样的交易。遗憾的是,OpenAI 可能就是这样的。
二.资金问题
上周,The Information 报道称,根据 “先前未公开的内部财务数据和业务相关人员的说法”,OpenAI 到 2024 年的亏损可能高达 50 亿美元。
这篇文章提出了几个有根据的预测,我会参考这些预测。虽然这些预测可能不准确,或者它们所基于的数据可能具有误导性或不正确,但我信任 The Information 的分析及其报道的严谨性:
“截至 2024 年 3 月,OpenAI 计划今年花 40 亿美元用于租用微软的服务器来支持 ChatGPT 及其底层的大语言模型,” 消息来源是 “直接了解支出的人员。”
“OpenAI 的训练成本 —— 包括支付数据费用 —— 今年可能会飙升至 30 亿美元。” 需要注意的是,训练成本不仅仅是获取数据,还包括清洗和准备数据 —— 这是一项繁重的任务 —— 然后使用大量的云计算来训练模型。
The Information “估计” OpenAI 的 1500 名(且不断增加的)员工每年可能花费约 15 亿美元。虽然这个数字听起来有点高 —— 特别是考虑到这个数字相当于每人 100 万美元 —— 但实际上是非常可能的。顶级 AI 人才非常昂贵,七位数的薪水并不罕见。然后你还得考虑办公空间、工资税、设备和其他运营成本。The Information 还预测,OpenAI 的收入在 35 亿到 45 亿美元之间,包括 ChatGPT 和向开发者收费以访问 OpenAI 的 API 来集成生成功能。The Information 推测,OpenAI 每年有 50 亿美元的运营亏损。这也假设 OpenAI 的收入处于较高水平,可能膨胀到 60 亿美元或更多。
虽然我们没有直接了解,但 OpenAI 的运营成本一直在持续增加。2023 年初的估计表明,当时运行 ChatGPT 每天的成本为 70 万美元,那时它虽然受欢迎但还没有像现在这么受欢迎,一年运营成本就达到了 2。353 亿美元。我还假设,基于 OpenAI 在过去五年内筹集了超过 130 亿美元,大部分资本(和信用额度)筹集发生在 2021 年到 2023 年期间,因此它们的成本要大得多。
根据报道,OpenAI 一直未能提高其模型的效率,未能在 2023 年末向微软交付更高效的 “Arrakis” 模型。虽然最近推出的 GPT-4o mini 模型被誉为 “效率” 之作,但似乎它仅对那些使用 OpenAI 工具进行开发的人来说更高效、更具成本效益,虽然有人可以认为这表明 OpenAI 找到了一种更高效 / 成本更低的模型并因此使其变得更便宜,但 OpenAI 尚未主动提供这些信息来证实。
假设一切都是凭空而来的,OpenAI 每年至少需要 50 亿美元的新资本才能生存。这将需要它筹集比历史上任何创业公司筹集的资金更多的资金,甚至可能是永久的资金,这将需要它以我在商业历史上找不到的规模来获取资金。
WeWork—— 硅谷的失败者 —— 总共筹集了 222 亿美元,其中近一半(超过 100 亿美元)是通过债务融资(具有不同条款的贷款)从高盛和软银的愿景基金筹集的,其中一些在公司倒闭时不得不重组。WeWork 的大部分资本是在利率较低且资金更加充裕的时期筹集的,并且严重依赖软银的持续投资。WeWork 还有一个更合理 —— 尽管非常愚蠢的 —— 商业模式,许多金融家能够理解,因此能够吸引更广泛的投资市场。
一个更合理的比较对象是 CoreWeave,这家公司为其他公司提供用于支持 AI 应用的庞大图形处理单元集群的访问(和构建)。CoreWeave 总共筹集了 121 亿美元 —— 你猜对了 —— 其中大部分是通过 Blackstone 和 Magnetar 提供的 “债务融资工具” 筹集的,该工具允许它以未公开(但可能较低)的利率提取现金。CoreWeave 的估值为 190 亿美元,与 OpenAI 不同,其服务相对简单。如果你需要大量计算能力,CoreWeave 会为你构建或租赁。
历史上,根据 Crunchbase 提供的数据,过去十年中最大的一轮融资是 2018 年蚂蚁集团筹集的 140 亿美元,其次是 2018 年 Juul 筹集的 128 亿美元。之后,OpenAI 主导了这一领域。
另一个例子是 Uber,这家公司因烧掉 250 亿美元以实现盈利而闻名,总共筹集了 250 亿美元,仅在 2018 年就进行了四轮不同的融资。即便如此,它也比 OpenAI 更赚钱,除了 2020 年,当时它亏损了 67 亿美元 —— 比 OpenAI 今年可能亏损的还多 17 亿美元 —— 因为人们没有出行。此外 —— 是的,我正在直接回应 The Information 的 “OpenAI 是一个好生意吗?” 的中心论点,即 OpenAI 也需要烧掉大量资金 ——Uber 立即有了一个人们理解的用例,并立即通过吞并出租车垄断来产生收入,这些垄断由风险资本大量补贴。
相反,OpenAI 没有吞并任何垄断,它创造的产品类别 —— 它唯一真正参与的类别 —— 完全由风险资本和微软补贴。OpenAI 提供的产品完全是由炒作驱动的,很难向普通人解释,这是一场由缺乏快速增长市场驱动的运动。
Uber 的定价是为了取代一个垄断,而且是大多数人讨厌的垄断。出租车很贵,不方便,供应人为稀缺(特别是在像纽约这样的城市,那里通过牌照系统限制出租车的供应),很少接受信用卡。更糟糕的是,司机对少数族裔背景的人有大量的歧视行为,并且这种行为没有受到处分。虽然我们可以不喜欢 Uber 这家公司并批评其商业行为,但你不能否认它从一开始就具有客观的吸引力。
相比之下,OpenAI 创造了一个行业范围的 FOMO(错失恐惧症),并从中大赚一笔,但向普通人解释什么是 ChatGPT 是有可能的,但是很复杂的,而 Uber 不是。
我还应该补充一点,媒体被 Uber 用来洗白 Uber 的声誉,专门用来(引用 Edward Ongweso Jr. 的话)让人们 “认为其增长是进步的,而不是寄生的”。重要的是要关注 OpenAI 和 Sam Altman 试图创造一个承诺其公司无法实现的事情的叙述,更重要的是不要试图解释 OpenAI 是如何不可持续的。媒体的任务根本不是让世界相信 OpenAI 是一家有稳定前景的公司 —— 那是 OpenAI 的任务。
截至其最后一轮融资 ——2024 年 2 月的二级市场(这意味着内部人士可以将其股票出售给风险投资公司)发行 ——OpenAI 的 “估值” 为 800 亿美元。我说 “估值”,因为微软的投资(可能提高了公司的估值,虽然我不能确认)主要是以虚拟货币、云信用额度,而不是任何实际的 “投资”。
此外,债务融资通常更难获得,具有繁重的现金条款,在经济不景气时,公司可能会陷入困境。如此规模的类似公司可谓凤毛麟角。根据 CBInsights 的数据,唯一能竞争的私人公司是 TikTok 开发商字节跳动(估值 2250 亿美元,筹集了 95 亿美元)和 SpaceX(估值 1500 亿美元,筹集了 98 亿美元),紧随其后的是 Stripe(估值 700 亿美元,筹集了 94 亿美元)、Shein(估值 660 亿美元,筹集了 41 亿美元)和 Databricks(估值 430 亿美元,筹集了 40 亿美元)。
这些案例中所涉及的公司,都赚到了钱,并拥有真正的商业模式。
字节跳动(拥有 TikTok 以及中国的几家公司)在 2023 年收入达到了 1200 亿美元,其服务被数亿人使用。
虽然 SpaceX 未盈利,但(无论好坏)它实际上与美国政府紧密相连,作为一个必要的承包商,并且通过大幅减少运营成本而成功赚取了数十亿美元。
Stripe 是世界上最受尊敬的支付公司之一,赚了数十亿美元,服务非常有用,并且 “现金流非常健康”。
虽然 Shein 是一家建立在剥削基础上的糟糕公司,但它每年流水超过 300 亿美元,销售产品的利润达到了 20 亿美元。
Databricks,一家无聊但有用的数据智能公司,在 4 月份报告称其季度收入达到了 16 亿美元,尚未实现盈利 —— 使其成为特例,可能是 OpenAI 最接近的类比对象。
但是,这些公司有一个共同的特点,它们已经证明了市场可行性。虽然 Databricks 可能在某种程度上未盈利,但它的融资时间更长(自 2013 年 A 轮融资以来),虽然它筹集了很多资金,但 OpenAI 必须能在更短的时间内筹集更多资金,并且很快就需要再次筹集资金。
SpaceX 制造的火箭有时会爆炸,但它仍然制造火箭和卫星,为人们提供互联网接入(Starlink 带来了数十亿美元的收入)—— 这不是对马斯克的认可,而是一个区别。Stripe 筹集了大量资金,但时间跨度更长,也提供了一个非常明显和有用的产品。我不需要解释为什么 TikTok 或抖音很重要,因为它们都是世界上最大的社交网络之一。
在所有这些情况下,它们筹集的资金都少于 OpenAI 到目前为止筹集的资金,尽管需要说明的是,OpenAI 的 100 亿美元轮融资主要是云信用额度。然而,这实际上提出了一个更棘手的问题:OpenAI 是否有能力筹集这么多资金?当 Stripe 在 2023 年筹集 65 亿美元时,其估值降至 500 亿美元,在 2024 年筹集 6.94 亿美元的要约时又回升至 650 亿美元。同样,Stripe 几乎是一个必要的服务,广泛用于帮助人们在互联网上购买东西。
OpenAI 的竞争对手 Anthropic 自 2021 年以来也不得不筹集超过 70 亿美元(包括来自亚马逊和谷歌的数十亿美元,这些也可能是云信用额度),The Information 报道称其 2024 年的花费可能达到 27 亿美元,而其收入为 8 亿美元,还必须与亚马逊分享。
我想确定的是,按照目前的速度,OpenAI 必须:
筹集比以往任何人都多的资金 —— 可能至少 30 亿美元,但更可能是 100 亿美元,并且很快就要这样做,可能要在接下来的六个月内完成。
筹集多轮资金,或者完成有史以来最大的资金筹集,然后必须持续这样做。
以大幅降轮 —— 通过以较低的估值筹集更多资金 —— 或以比任何私营公司历史上更高的估值筹集。
在所有这些情况下,OpenAI 必须向投资者展示如何增加收入和减少成本,并且要以这样的方式让投资者放心,OpenAI 不会在几个月后再次要求更多资金。它可能还需要修改其公司结构,正如 Sam Altman 所建议的那样。
这并非不可能,但 OpenAI 在未来几年内实现这一目标的可能性极小。报道表明 OpenAI 离通用人工智能还很远,虽然 Altman 可能会再次从急于加入公司的风险投资家那里筹集另一轮资金,但这样做会有暴露烧钱速度有多严重的风险。
如果我们假设 OpenAI 在 2024 年 2 月的二级市场融资是最好的情况 ——50 亿美元的现金,我猜可能更少,我们确实不知道 —— 公司在未来 12 个月内仍然需要另一条生命线。在更现实的情况下,我认为 OpenAI 必须在接下来的 3-6 个月内融资,这将意味着在微软即将于 7 月 30 日发布的财报后至少一个季度的财报后进行融资。
假设即使是每年 30 亿美元的烧钱率 —— 这将需要显著减少成本 ——OpenAI 仍然必须筹集比任何公司以往筹集的更多的资金,只要需要就要增加收入或减少成本。这非常令人担忧,同样不可持续。
三.收入、成本和市场适应性问题
正如我反复写的那样,生成式 AI 是无利可图的,根据 The Information 的估计,商品销售成本是不可持续的。OpenAI 的成本一直在增加,使这些模型 “更好” 的成本也在增加,尚未解决那些能够证明其成本合理的复杂问题。“更好” 也是一个有些误导的词 —— 一个 “更好” 的 ChatGPT 版本可能更快,给出更准确的答案或生成速度更快,但它无法做更多的事情。
自 2022 年 11 月以来,ChatGPT 变得更加复杂,生成速度更快,能够摄取更多数据,但尚未产生真正的 “杀手级应用”,一个类似 iPhone 的时刻。
此外,基于 Transformer 的模型已经高度商品化,竞争来自像 Anthropic 的 Claude 和 Meta 的 LLama 等独立公司,所有这些都在同样的大量数据集上进行训练,以至于 ChatGPT 的最大优势在于其品牌。因此,我们已经看到了一场价格战,GPT-4o Mini(OpenAI 的 “廉价” 模型)已经被 Anthropic 的 Claude Haiku 模型在价格上击败,我相信有人已经在努力开发一个同样强大的模型,并以更便宜的价格出售。
因此,OpenAI 的收入可能会增加,但可能是通过降低其服务成本而不是其自身运营成本来实现的。OpenAI 似乎在采用标准的硅谷垄断模式 —— 尽可能多地吸引客户,然后再想办法盈利 —— 但它使用的是一种运营和迭代成本特别高的技术。如前所述,OpenAI—— 像每个基于 Transformer 的模型开发者一样 —— 需要大量的训练数据来使其模型 “更好”,下一代 GPT 将需要比 GPT-4 多四到五倍的数据,而此时出版商和整个互联网已经找到了许多阻止他们获取数据的方法。
这样做也可能导致持续的法律诉讼,尤其是 404 Media 报道称,视频生成公司 Runway 可能在 YouTube 和盗版来源上获取了数千小时的视频来训练其模型。当被问及是否在 YouTube 视频上训练其 “Sora” 模型时,OpenAI 表现得非常回避,如果让我猜,我会说绝对是。如果没有,它可能需要购买数万 —— 甚至数百万 —— 小时的视频,这将比它支付给 News Corp 的 2.5 亿美元用于训练其文章贵得多。
需要明确的是,我不确定是否有足够的训练数据来让这些模型超越下一代。即使生成式 AI 公司能够合法且自由地下载互联网上的每一段文字和视觉媒体,似乎也不足以训练这些模型,有些模型开发者可能会转向模型生成的 “合成” 数据 —— 这可能会引发 “模型崩溃”,Jathan Sadowski 称其为 “哈布斯堡 AI”,这种情况会随着时间的推移毁坏模型。
即使他们以合法的方式(明确说明,我认为这是不可能的)成功地获得了如此多的训练数据,他们仍将面临训练这些模型的成本不断增加的问题。Anthropic CEO 最近在播客上表示,“成本 10 亿美元的 AI 模型正在进行中”,未来的模型将耗资 1000 亿美元。随着模型变得更复杂并需要更多的训练数据,摄取更大(且可能更复杂)的训练数据的成本也会增加。
然后是一个非常大的烦恼问题 —— 生成式 AI 尚未在支持其存在所需的规模上找到产品市场契合点。需要明确的是,我并不是说生成式 AI 完全没有用,也不是说它没有任何产品市场契合度。它对于挖掘大量数据集、快速总结文章(无论好坏)和生成图像非常有用。这些模型有用处,尽管这些模型有 “幻觉” 的倾向(权威地陈述不真实的东西,或者生成手指过多的手),人们正在找到它们可以做的有用事情,特别是在金融领域。
但它们目前不是必需的。生成式 AI 尚未提出一个你绝对必须整合它的理由,除非你觉得如果不使用 AI,你的公司就会 “落后”。这在生成式 AI 的运营成本仅是当前成本的极小一部分 —— 数万或数十万百分之一 —— 时不会是一个问题,但就目前而言,OpenAI 实际上在补贴生成式 AI 运动,同时处理这样一个问题:虽然很酷也很有用,但 GPT 改变世界的程度仅限于市场允许的范围。
虽然复杂,但生成式 AI 是一种概率生成答案的技术,没有 “智能”。它本质上受到其架构的限制,反过来只能以线性方式 “变得更好”。我没有看到 Transformer 架构能做得比目前更多的迹象。为了继续增长,OpenAI 要么大幅增加功能 —— 这尚未实现,但理论上可能 —— 要么大幅降低价格,这只会增加其运营成本。
而且 OpenAI 必须增长,因为每年 35 亿到 45 亿美元的收入不足以维持这家公司。这与我对生成式 AI 的个人看法无关。事实是,这家公司运营的成本比任何其他私营创业公司都要高,而其技术 —— 根据 OpenAI 的销售情况 —— 并不足以弥补其成本高昂的事实。
除了降低价格,这会增加收入和运营成本,OpenAI 理论上可以在 GPT 中找到新功能 —— 虽然我不确定如何做到 —— 或者创造一些完全不同的东西,但它尚未显示出任何迹象。虽然你可以指向像 Sora 这样的工具(它似乎并不特别有用,离商业化还很远),或者 searchGPT(它会有困扰谷歌搜索的幻觉问题,同时还要与 GPT 驱动的 Bing 竞争),很难证明这些产品会填补 OpenAI 资产负债表上的巨大缺口,并可能只会增加其运营成本。
7 月,路透社报道 OpenAI 正在 “开发一种名为 Strawberry 的新技术”,这种技术能够 “提供先进的推理能力”。然而,深入阅读文章后,发现 OpenAI 正在思考和尝试实现这一点,但目前还没行动。如果成功 —— 我补充一下,这可能需要完全新的心理学和数学分支,因为我们人类几乎不了解我们的脑子 —— 这将是一个巨大的技术成就,但仍不足以扭转局面。OpenAI 将拥有一种全新的技术,这将非常有价值,可能会因此永久融资,但它将极大地依赖于推理的水平及其能够实现的伴随任务。
需要明确的是,这非常非常不可能发生。这可能 —— 我可能不了解 OpenAI 的研究和开发的所有内容 —— 但我们几乎没有看到 OpenAI 创新的迹象,而更多的迹象表明它目前只能在 GPT 上进行迭代。OpenAI 在营销方面也有问题。Sam Altman 多次误导媒体关于 “AI 可能做什么”,将生成式 AI—— 它并不 “知道” 东西,也不是 “智能”—— 与完全理论上的自主、感知 AI 混为一谈。结果,未来 GPT 可能会做什么的期望值更高,这使得公司不可避免地会让投资者和客户失望。
虽然可能有方法减少基于 Transformer 模型的成本,但成本减少的幅度将是前所未有的,可能需要全新的芯片、冷却解决方案和物理服务器架构,而这些 OpenAI 并不开发。
理论上,Nvidia 可以生产出更高效的芯片,但这样做可能比 OpenAI 所能承受的时间要长。虽然有像 Etched 这样的公司声称他们正在开发专用芯片,但他们距离交付 OpenAI 所需规模的工作芯片还有很长时间,而且这些芯片专注于单一模型,使其成为迭代而非创新的概念。
我没有重点讨论的一件事是,生成式 AI 似乎还没有得到普遍采用。这些数字很难确定,但我之前可以肯定的是 —— 特别是基于高盛的报道 —— 实际的有意义的收入尚未出现。这是比缺乏采用还大的生存威胁。这意味着人们在使用它,但没有从中获得足够的收益,这可能会导致收入大幅降低,因为炒作周期在逐渐消退。
总结一下:
1.OpenAI 唯一真正的选择是降低成本或其产品的价格。到目前为止,它在降低成本方面没有成功,降低价格只会增加成本。
2.为了发展 OpenAI 核心产品 GPT 的下一代模型,该公司必须找到新的功能。
3.OpenAI 本质上受限于 GPT 的 Transformer 架构,它实际上并不能自动化事务,结果可能只能做得 “更多” 和 “更快”,这并不会对产品产生重大影响,至少不会使其达到应有的价值。
4.OpenAI 唯一的其他选择是发明一种全新的技术,并能够将其产品化和货币化,这是公司尚未能够做到的。
关于能源的说明:我列出的大多数问题都是 OpenAI 未来的生存威胁,我看不到任何快速或简单的解决方法,并且它还有一个更大障碍 —— 能源。为了扩大规模,OpenAI 需要在多个层面进行大规模资金支出,首要的是美国电网,这可能需要数十年来从未见过的广泛扩展,而此时的美国在基础设施发展方面远不如从前。
虽然美国在 20 世纪下半叶稳步增加了新的发电能力,但在 2010 年代开始停滞。这是多种因素共同作用的结果。电力消费在家庭和企业中保持平稳或略有下降。虽然美国增加了发电能力,特别是在可再生能源和天然气方面,但这并没有增加可用的电力生成量,而是抵消了煤电厂的退役。
扩展 AI 将需要一个相当于艾森豪威尔州际公路系统规模的投资,并且需要迅速进行。这在发电领域是不可能发生的。作为参考,2021 年,新的太阳能发电厂平均需要 2.8 年才能接入电网。两年后,这个时间增加到四年。小型模块化反应堆 —— 一种旨在降低核电生成成本和建设时间的有前景的方法 —— 还远未实现大规模商业化,即使不是这样,它们仍需应对该行业的官僚主义。
即使改变这种状况是可能的 —— 如果可能的话,这对社会是有好处的 ——AI(由生成式 AI 驱动)已经在大幅增加全球排放,特别是来自谷歌这样的公司,由于 AI,其排放量在过去五年中增加了 48%。
OpenAI 要想继续扩张,就必须依赖电网的大幅扩张,而此时(根据 Cloverleaf Infrastructure 的 Brian Janous)启动新的电力项目的等待时间在 40 到 70 个月之间。并且 OpenAI 不是进行扩展的公司 —— 就像它依赖 Nvidia 继续生产用于生成式 AI 云计算的 GPU 一样,它也依赖于微软、谷歌和 Oracle 等公司与电力公司合作扩展电网。
四.严峻的形势
我在这里写的所有内容都不是基于个人的不满,也不是对生成式 AI 的反感,而只是对一家我认为可能正处于崩溃边缘的公司进行坦率评估。为了让 OpenAI 继续运营,必须做出巨大的改变。如果 OpenAI 的收入处于其报告范围的高端 ——45 亿美元 —— 并且它现在有这么多现金,它必须在未来 12 个月内至少筹集 20 亿美元,如果能筹集 100 亿美元更好。
如果它的银行存款不到 10 亿美元,OpenAI 可能需要在未来三到六个月内筹集 50 亿美元。否则,OpenAI 要么必须至少将其运营成本减半,同时保持当前的收入速度,要么找到一种方法在保持成本不变的情况下将收入翻倍。即便如此,这些数字也很令人担忧 —— 尽管我补充说,总有一些我不知道的事情,因为 OpenAI 是一家私营公司,不受上市公司披露规则的约束。
要生存,OpenAI 必须筹集比往任何人筹集的资金多的多的资金。这在技术上是可能的,但需要风险资本家和投资银行实际提供永续的生命线,除非公司能够大幅减少成本或找到数十亿美元的额外收入。即使成功,如果收入成本随着销售的增加而增加,所有增长都将毫无意义,并会带来进一步的问题和对风险资本 —— 或像微软这样的公司的依赖。
这将需要一种扩展 OpenAI 销售的方式,以满足整个美国企业的需求,这需要生成式 AI 无法满足的用例,如自动化经济的大部分,而不是破产自由设计师和文案编辑。需要明确的是,我并不是主张用 AI 取代工人。我只是说为了让 OpenAI 增长到每年 10 亿美元以上的收入,它需要取代整个劳动大军的一部分。而且要提醒的是,生成式 AI 不是自动化。
即使这些问题可以克服,训练数据也不够,即使有,处理它的成本也可能远远超过 OpenAI 的收入。即使解决了这个问题 —— 这可能需要至少 300 亿美元的云信用 —— 这样做也不一定能让基于 Transformer 的模型具备每年销售 10 亿美元软件所需的能力。
如果让我选一个数字,我假设 OpenAI 需要在未来两年内筹集 200 亿美元才能继续游戏,而要进一步发展 —— 这并不保证 —— 将再花费 200 亿美元。作为参考,根据 Crunchbase 的数据,2023 年所有融资的总和为 2992 亿美元,而 2024 年至今已筹集了 1470 亿美元。
OpenAI 将不得不经常占到所有初创公司融资的 5-10%,永远如此,至少直到它弄清楚如何减少损失或赚更多的钱。此外,我假设生成式 AI 的价格竞争将严重阻碍 OpenAI 扩展收入的能力,再加上我们正在接近 Transformer 架构的极限。
因为 OpenAI(和竞争对手)在 Transformer 模型上投入了如此之深,我相信他们会继续投入数十亿美元,花费大量资金训练这些数据,这些数据可能是合法获取的,也可能不是,任何有利于原告的诉讼都可能对这些模型产生灾难性的影响,需要重新从头开始用全新的数据集进行训练,成本将高达数亿美元或数十亿美元。
坦率地说,我不确定 OpenAI 如何使这一切成为可能。
虽然 OpenAI 可以 —— 而且我相信会 —— 再筹集一轮巨额、定义行业的资金,但这样做将需要吸引加拿大养老金基金、沙特主权财富基金或需要大量股权的大型投资基金。多次这样做是可能的,但可能性非常非常小,就像每年继续以 100% 的速度增加收入是可能的,但可能性非常非常小一样。它可能会想出新的东西,或者找到一种方法使生成式 AI 更便宜,但同样,这非常非常不可能。
OpenAI 可能是有史以来最重要的科技公司,因为它必须吞噬硅谷的众神才能继续其贪婪的增长。这样一来,它将打破融资和软件收入的记录,同时还要抵御初创公司以及其自己的投资者微软的竞争。我不知道 OpenAI 如何做到这一点。写这篇文章花了我几个小时,在这样做的过程中,我真心想弄清楚 OpenAI 是如何生存下来的,每一个转角都以 “如果它能做到一些从未发生过的事情,它就能做到” 结束。
我以冷静的语气写这篇文章,因为我需要人们认真对待我所说的话,为了生存,生成式 AI 必须做得比目前多得多,并且比目前的成本低得多。为了生存,OpenAI 必须打破所有已知的初创公司记录,要繁荣,它必须重新发明 Transformer 架构以减少其计算需求,然后发明一种全新的 AI 来做人们想要 AI 做的事情。
也许我错了。也许有些事情我不知道 —— 关于 OpenAI,关于他们秘密进行的工作,关于某种即将到来的能源或芯片突破。也许他们银行里的钱比我想象的要多,或者他们的成本目前膨胀的方式是我 —— 以及整个科技媒体 —— 不知道的。
但如果有的话,我相信我们会知道,或者至少有一些迹象。
我不知道接下来会发生什么,但我知道事情必须改变。我担心 OpenAI 会在价格上竞争,使其成本上升,或者收取需要接近收支平衡的费用,我认为他们不愿意这样做。我为 Anthropic 感到担忧,它的资金更少,收入更少,烧钱同样严重。我为那些依赖当前 GPT 和其他模型定价的创始人感到担忧。
没有 OpenAI,整个生成式 AI 市场将崩塌,而且很可能会重创与生成式 AI 热潮相关的所有上市公司。我尽力在这里详细解释我的假设,如果你不同意我,告诉我我错在哪里 —— 向我解释我遗漏了什么,指出我的逻辑或数学中的错误。
我提醒你不要轻视我,即使我写的内容让你深感不安。我在这里描述的是一家被许多人寄予厚望的不可持续的公司,即使我错了,当一家公司烧掉数十亿美元,可能会试图吸收更多的资本来生存时,这种分析也是必要的。这个讨论既必要又令人不安,其含义和可能性令人不舒服,其潜在结果令人不安。
我希望是我错了。