这个故事告诉我们,不要忽视你在顶会上遇到的每个其貌不扬的研究者,说不准在哪天,他们的公司就会获得顶级融资,诞生下一个Sam Altman。没有一份钱创收,但已筹集数亿,这样的奇迹,只有在硅谷才会发生。
目前,Imbue正在训练的「超大规模」大模型,参数已经超过1000亿,并且,Imbue目前手握1万张英伟达H100 GPU。公司还未发布任何产品,仅在去年秋天发布了Avalon开源训练环境。不过,Imbue的此轮融资金额,是先前已筹集金额的10倍。由亿万富豪Jed McCaleb成立的非营利组织Astera Institute领投,参投方包括英伟达、通用汽车旗下自动驾驶公司Cruise首席执行官Kyle Vogt、Notion联合创始人Simon Last等。
现在,Imbue的融资总额已经达到2.2亿美元,已跻身为最近几月融资状况最好的初创公司之一。少数在它前面的,就是Cohere(4.35亿美元),Adept(4.15亿美元),以及AI21 Labs(2.83亿美元)。参投方中最引人注目的名字,无疑就是英伟达。就在今年,英伟达已经连投7家AI独角兽,包括Adept、Coreweave、Cohere、Inflection、Runway、AI21 Labs,以及Imbue。
对于市场,Imbue的态度并不急切,这一点,从融资上也可以看出——主要投资方,是致力于科技项目的非营利组织Astera Institute,而非趁热一拥而入AI项目的风投公司。两位创始人表示,在融资过程中,他们有意避免了与风投公司会面。这是因为,在他们看来,Imbue的工作离真正商业化落地或许还需数年,风投公司不会有这种耐心,而非营利组织会对他们的商业化时间表更加宽容。
最大投资人、亿万富豪Jed McCaleb表示,自己在看完Qiu和Albrecht建立AI智能体的PPT后,觉得非常满意,因此大手一挥,拍板决定投资。当然,他也明白,这是一场豪赌:为了把研究推进到下一个阶段,把实验室的工作产品化,光GPU的投入,就要烧掉不少钱。Qiu和Albrecht也非常有信心,在十年后,PPT上的成果,很可能就变为人们日常的应用,而且,很可能用不了十年。
在Imbue的官方博客里,他们是这么解释的——目前,AI系统在代替用户完成简单任务方面,能力非常有限。这其中的一个重要阻碍因素就是「推理」。可以说,强大的推理能力是AI智能体实现有效行动的必要条件。对此,我们可以进一步细分成:处理不确定性的能力、知道何时改变方法的能力、提出问题和收集新信息的能力、推演情景和做出决策的能力、提出和放弃假设的能力,以及处理现实世界复杂而难以预测的本质的能力。
要想为「会推理的AI智能体」量身定制基础模型,就意味着不仅要利用LLM所提供的强大功能,同时还要以详细、实用的方式了解这些模型是如何训练的,以及它们在哪些方面会出错。也就是说,一方面需要创建专门用于强化模型推理的预训练数据,另一方面还要开发出能够让推理结果更加可靠的技术。为此,团队采用了全栈式的方法:训练基础模型、制作实验智能体和界面原型、构建稳健的工具和基础设施,以及了解模型如何学习的理论基础。
要想让AI智能体与人类一起稳定地工作,最佳途径就是制造能够用于日常工作的AI智能体,并在此过程中解决各种问题。
首先,在代码上进行训练有助于模型更好地学会推理。其次,由于编程问题非常客观(代码要么通过测试,要么不通过),因此可以为更广泛的推理能力测试提供了一个相对理想的平台,从而让团队能够了解到他们对底层系统的改进是否有效。
生成代码是智能体与计算机上进行交互的有效方式。更强的编码能力可以直接转化为更有可能成功完成复杂任务的智能体。例如,会编写SQL查询从表格中提取信息的智能体,要比直接尝试汇集相同信息的智能体更有可能满足用户的需求。
随着不断的改进,智能体可以接管更多的工作,从而加快研究和工程的速度。这样,不仅有助于软件系统的构建,而且还能帮助建立起一个组织的原型,看看真正可用的AI智能体会是什么样子。
目前,团队并没有把这些「代码智能体」投入生产的打算。不过,他们预计会在一段时间之后,公开这些工具和模型,让任何人都能创建出自己的AI智能体。真正的个人计算机,让我们自由、有尊严、有能力做自己喜欢的事情真正有用的AI智能体,实际上就是一个能理解目标、会主动沟通并在背后为我们工作的计算机——从而消除想法与执行之间的障碍。
而我们也不必再盯着屏幕,而是可以自由地探索自己的好奇心,发现宇宙的规律,创造艺术杰作,更深入地了解彼此,或者只是花时间享受生活。