苹果近日与麻省理工学院、卡内基梅隆大学、华盛顿大学和加州大学圣地亚哥分校联合发布了一项机器人研究,提出通过第一人称视角的视频来训练人形机器人,并在论文《Humanoid Policy ∼ Human Policy》中披露了具体成果。
为实现这一方案,研究人员开发了一款运行在 Vision Pro 上的应用,能够利用设备左下角的摄像头采集画面,并结合苹果 ARKit 框架记录用户头部与手部的三维动作轨迹。硬件方面,团队还设计了 3D 打印支架,让 ZED Mini 立体摄像头可以安装到包括 Meta Quest 3 在内的其他主流头显设备上,从而实现更便宜的数据采集方案。