• 专注物理AI数据处理的初创公司NomadicML宣布完成840万美元种子轮融资
  • 发布于 1小时前
  • 2 热度
    0 评论

堆代码讯 周二,专注物理 AI 数据处理的初创公司 NomadicML 宣布完成 840 万美元种子轮融资,估值达到 5000万美元,这句企业试图解决自主智能设备行业的一大核心痛点:海量训练数据闲置,企业空有海量影像素材却无法挖掘其价值。


当下,研发自动驾驶汽车、物理交互机器人以及自主工程设备的企业,都会采集数万乃至数十万小时的视频数据,用于算法评估与模型训练。但长期以来,整理归档这些海量数据的工作,完全依赖人工逐条审阅,即便开启倍速播放,人工处理的效率也完全跟不上行业规模化的需求。更棘手的是,对模型训练最有价值的极端边缘场景数据,恰恰是那些罕见的突发状况,人工筛选这类数据的难度更是呈指数级上升。这也导致当下多数企业 95% 的车队运行数据,最终只能封存在服务器中,彻底沦为无法产生价值的闲置资源。

NomadicML 的解决方案,就是用 AI 来盘活这些 “数据金矿”。该公司打造的专属平台,依托多套视觉语言模型,能将原始的影像素材,转化为结构化、可检索的标准数据集。这不仅能帮助企业优化车队的全域监控能力,还能快速生成定制化的数据集,直接用于强化学习训练,大幅加快算法的迭代速度。

举个例子:企业若想优化自动驾驶的特殊场景逻辑,比如让车辆学会识别交警手势、在指挥下合规通行,或是想要提取所有车辆途经特定桥梁的行驶画面,借助 NomadicML 的平台,就能快速定位到所有相关的影像片段,既可以满足合规核查的需求,还能直接将这些数据接入模型的训练流程,无需人工再耗费数月时间筛选素材。


目前,Zoox、三菱电机、Natix Network、Zendar 等头部智能设备企业,都已经接入了该平台。Zendar 的工程副总裁安东尼奥・普格里利就表示,搭配 NomadicML 的工具,公司的研发效率远比外包标注要高得多,而 NomadicML 团队的垂直领域专业能力,也让它和其他竞品拉开了差距。两位创始人本科均就读于哈佛大学计算机专业,首席执行官穆斯塔法・巴尔向 TechCrunch 透露,两人此前在 Lyft、Snowflake 等企业任职时,反复遭遇同类的数据处理瓶颈,这才决心创业解决这一问题。此前,NomadicML 还拿下了英伟达 GTC 全球创业路演大赛的一等奖,验证了其技术的竞争力。


如今,依托 AI 的自动标注工具,已经成为物理 AI 领域的核心工作流,Scale、Kognic、Encord 等老牌数据标注企业都在布局同类 AI 工具,英伟达也开源了 Alpamayo 系列模型来解决这类问题。但 NomadicML 的首席技术官瓦伦・克里希南强调,自家的产品远不止是标注工具:它是一套具备自主推理能力的智能系统,用户只需描述自己的需求,平台就能依托多模型理解画面中的动作、结合场景上下文,精准定位目标内容,而非简单的标签生成。


这一赛道的价值也得到了资本的认可,本轮融资由 TQ Ventures 领投,Pear VC 与谷歌资深科学家杰夫・迪恩参与跟投,资金将用于拓展客户、打磨平台。TQ 的合伙人舒斯特・坦格就表示,这就像 Salesforce 不会自研底层云架构、Netflix 不会自建内容分发基建一样,自动驾驶企业如果自己搭建这套数据体系,反而会偏离自己的核心赛道 —— 打磨机器人与自动驾驶的本体技术。他也盛赞了 NomadicML 的团队:首席技术官克里希南是全球排名 1549 位的国际象棋特级大师,而公司的十余名工程师,全员都发表过专业学术论文。


眼下,团队正在深耕定制化工具的研发,比如通过影像解析变道的物理逻辑,或是精准定位机器人机械爪的实时坐标。而未来的攻坚方向,是突破纯视觉的局限,适配激光雷达这类非视觉的传感数据,实现多模态数据的融合分析。正如巴尔所言,调度 TB 级的海量视频、对接数百个千亿参数的大模型、最终提炼出精准的有效洞察,这项技术的难度极高,而这正是他们要攻克的核心壁垒。
用户评论