闽公网安备 35020302035485号
堆代码讯 当大型语言模型开始席卷生物医学领域,所有人都在期待 AI 能彻底改变医学:加速基因组研究、简化临床记录、加快药物研发…… 但一个绕不开的瓶颈卡住了整个行业的脚步:数据。对于罕见病、特殊病症这类边缘案例,可靠的标注数据极度稀缺;而就算有数据,患者隐私、伦理监管的限制,也让真实的医疗数据无法被自由用于 AI 训练与研究。
总部位于纽约的初创公司螳螂生物技术(Mantis Biotech),试图用一种全新的方案打破这个僵局:打造人体的 “数字孪生体”。通过生成符合真实人体物理规律的合成数据,他们试图彻底解决医学领域的数据可获得性难题 —— 不用真实患者的隐私数据,也能开展医疗研究、训练 AI 模型。
长期以来,生物医学领域的 AI 发展,都被数据问题牢牢卡住。基于海量数据训练的大模型,在常见病、标准化的医疗场景中表现亮眼,但一旦碰到罕见病、特殊生理特征这类边缘案例,就立刻 “失灵”—— 因为根本没有足够的、有代表性的标注数据来训练模型。更棘手的是隐私与伦理的枷锁。为了保护患者隐私,各国的监管都对医疗数据的使用设置了严格的限制:将患者的真实医疗数据纳入公共数据集、或是用于训练 AI,往往面临巨大的伦理与合规风险。这就导致了一个尴尬的局面:一边是海量的研究需求等着数据,另一边是大量的真实数据因为隐私限制,根本无法被利用。
数据的匮乏,也直接拖慢了整个医学行业的进度。据行业统计,仅仅是数据不准确这一个问题,就导致了约 80% 的临床试验出现延迟,每一次延迟都意味着数亿美元的成本浪费,以及新药上市时间的推后。对于罕见病领域而言,这个问题更加致命:很多罕见病的患者总数太少,根本无法凑够临床试验需要的样本量,导致无数潜在的新药永远无法完成试验、推向市场。
Mantis 的解决方案,就是跳出对真实患者数据的依赖,自己造数据 —— 打造基于物理学的人体数字孪生体。这家公司的平台,首先会整合来自各个渠道的分散数据:从医学教科书、动作捕捉相机的记录,到生物传感器的监测数据、运动员的训练日志,再到临床的医学影像,所有和人体相关的信息,都会被整合到一起。随后,平台会用基于大语言模型(LLM)的系统,对这些格式各异的数据流进行路由、验证与合成,最终将所有信息输入一个物理引擎,生成高保真的人体数字孪生模型。
这个物理引擎,正是整个技术的核心。和普通的 AI 生成数据不同,Mantis 的数字孪生,是完全基于真实的人体解剖、生理物理规律构建的,这意味着生成的所有合成数据,都符合现实世界的物理规则,绝非凭空捏造的虚假信息。这也就让他们能轻松解决边缘案例的数据缺口。Mantis 的创始人兼 CEO 乔治亚・威切尔举了一个例子:如果要对一名缺指者做手部姿势估计,传统的 AI 根本做不到 —— 因为没有任何公开的、标注过的缺指者手部姿势数据集。但对 Mantis 的模型来说,这太简单了:“我们只需要调用物理模型,输入指令‘移除 X 手指’,然后重新生成模型就行,瞬间就能拿到我们需要的数据集。”
也就是说,只要有了这个通用的人体物理模型,不管是什么样的罕见生理特征、特殊的边缘案例,Mantis 都能快速生成对应的、符合现实的合成数据,彻底填补了数据的缺口。
目前,Mantis 的技术已经率先在职业体育领域落地,这也刚好印证了技术的可行性。对于职业体育而言,对运动员的状态建模、损伤预测,是一个极强的需求,而 Mantis 的数字孪生刚好能满足这一点。威切尔透露,公司目前的主要客户之一,就包括一支 NBA 球队。他们为运动员打造专属的数字孪生体,能够完整还原运动员过去一整年的所有状态数据:每一天的跳跃动作变化,以及这些变化如何和睡眠时间、训练负荷、饮食情况联动,从而精准预测运动员的损伤风险。比如,一支 NFL 球队,可以通过这个模型,提前预测某名球员患上跟腱损伤的概率,从而提前调整训练计划,避免伤病。
但这只是开始。威切尔认为,这项技术的潜力,远不止于体育领域,它能彻底改变整个生物医学行业。未来,Mantis 计划将这项技术推广到预防性医疗领域,向普通用户开放平台,帮助普通人提前预测健康风险;更重要的是,他们正在将这项技术推向制药与临床试验领域 —— 为 FDA 的药物试验提供虚拟患者模型。
对于制药公司而言,这意味着他们可以在数字孪生的虚拟患者身上测试新药,模拟不同患者对药物的反应,不用再花费大量的时间和成本去招募真实的临床试验患者,尤其是对于罕见病来说,这几乎是唯一可行的试验方案。更重要的是,这彻底解决了隐私的问题。威切尔说,她希望人们能像小孩玩芭比娃娃一样对待这些数字孪生体:不用有任何顾虑,随便测试、随便研究,因为这只是虚拟的模型,根本不会侵犯任何真实用户的隐私。“我认为人们的真实数据根本不应该被利用,尤其是在我们有这些数字孪生体的情况下。”
四.740 万种子轮落地,虚拟医疗的未来正在到来
近日,Mantis 刚刚完成了 740 万美元的种子轮融资,由 Decibel 风投领投,Y Combinator 等机构跟投。这笔资金将被用于团队招聘、市场推广,加速技术的落地。对于整个医学行业而言,Mantis 的探索,打开了一个全新的方向:我们终于不用再在 “研究需求” 和 “患者隐私” 之间做两难选择了。通过数字孪生生成的合成数据,我们既能加速医学研究、加快药物研发,又能彻底保护患者的隐私,不用再触碰真实的敏感数据。