我们试戴了谷歌的AI眼镜，离成功只差一步-堆代码网

我们试戴了谷歌的AI眼镜，离成功只差一步

发布于 1小时前
 7 热度

 0 评论

猫千千
0 粉丝 31 篇博客

堆代码讯在本周举行的谷歌I/O开发者大会上，我们有幸短暂上手体验了谷歌即将推出的AI眼镜——不是该公司表示将于今年秋季开始发货的纯音频眼镜，而是提供音频与视觉结合体验的那款眼镜。这款Android XR眼镜首次发布于去年的大会，它提供了镜片内置显示屏，能够将有用的信息呈现在你眼前，并叠加在现实世界之上。其中包括可显示天气、步行导航、优步接载详情、实时翻译等的小组件——甚至包括你利用AI自行设计的小组件。谷歌公司还指出，这款眼镜将兼容iOS和安卓手机，无论是纯音频版本还是未来的显示版本都将如此。

带显示屏的眼镜被视作继今年晚些时候推出的第一代音频眼镜之后的下一步产品。该眼镜是与Warby Parker、Gentle Monster和三星合作开发的，将谷歌的技术与这些品牌的设计美学融为一体。

与此同时，我们测试的眼镜仍处于非常初期的原型机阶段，不过其完善程度已足以进行外部测试。演示XR眼镜的工作人员解释说，这款原型机让谷歌无需操心与不同款式和形状相关的外观细节，从而可以更自由地专注于显示技术及其对电池续航影响的实验。这意味着，在佩戴舒适度、外形、尺寸以及对细节的关注度方面，这款眼镜与任何未来正式发货的版本都非常不同。它更像是让你能够体验眼镜的“内部构造”，同时仍采用基础且舒适的镜架。

正式发货版本的眼镜将能够检测到眼镜何时被戴在头上、何时被取下，但我们试用的这款没有这个功能。

要激活Gemini，你需要在眼镜镜腿右侧按压两秒钟。会响起一声启动提示音，让你知道Gemini已开启并正在聆听。在演示版本中，启动Gemini的同时也会启动摄像头，但正式发货版本将允许用户自行配置是否要在Gemini启动时开启摄像头。

在首次测试中，我们通过眼镜播放音乐，让Gemini播放我们喜欢的艺人作品。可惜的是，现场环境过于嘈杂，无法评估音质，因为音乐音量已调到最大，但仍然相对难以听清细节。不过，从这次有限的体验中得到的初步印象是，这款眼镜并不能很好地替代更高质量的耳机，但如果你只是想在户外、散步、徒步或做家务时听点音乐，它还是可以胜任的。不戴耳机的优势在于，与苹果AirPods等设备的通透模式相比，你可以更轻松地听到别人说话。要关闭音乐，只需轻点镜腿侧面中部附近，就像轻点自己的太阳穴一样。

在第二次测试中，我们按下拍照按钮给一个人拍了张照片。当时显示屏是关闭的，所以照片被传输到了我们的手机和手表上。（未来可以通过长按来拍摄视频，但原型机暂未提供此选项进行测试。拍摄视频时，你将看到视频缩略图预览，而不是照片。）

你也可以直接让Gemini拍照，而无需按下拍照按钮，并对拍摄结果进行某种AI处理。例如，你可以说：“拍张照片，把这个人变成动漫角色。”照片会被发送到手机，然后传到Gemini和Nano Banana服务器，最后返回编辑后的版本。

在谷歌I/O会场，由于Wi-Fi负载较重，整个往返过程耗时约45秒。

当显示屏启用时，你会在视野中看到一个简单的首页屏幕。演示版本预装了一些小组件，显示天气和距离谷歌I/O大会的倒计时。你还可以为特定应用（如谷歌地图或翻译）创建快速启动器，如果这些是你的眼镜主要使用场景的话。该原型机只在右眼上方有一个显示屏，但该平台可以支持单显示、双显示以及纯音频眼镜。画面本身有点模糊，但我们将其归因于我们佩戴的定制隐形眼镜——我们一只眼佩戴了针对远视优化的镜片，另一只佩戴了针对近视优化的镜片。当我们闭上一只眼时，画面变得更清晰，但这种体验几乎立刻让我们的右眼上方感到一些眼疲劳，目前还不清楚是否完全是因为隐形眼镜的度数问题。

最精彩的演示之一是在眼镜上进行的语言翻译体验，该功能由手机上的谷歌翻译应用提供支持。一位演示者说着快速的西班牙语，眼镜自动检测到该语言，并在显示屏上以英文显示文本，同时Gemini在我们耳边用英语说出译文。我们可以看到，世界各地的旅行者仅为了这一体验就愿意购买这款眼镜。需要说明的是，翻译功能也将在纯音频眼镜上可用，只是不会有文本显示在眼镜上。相反，除了实时音频反馈外，你可以在手机上看到转录文本（如果需要的话）。

另一个演示涉及使用眼镜进行导航。显然，我们无法离开会场出去散步来测试其准确性，但可以了解其工作原理。你可以通过让Gemini导航到某个目的地来启动谷歌地图体验——目的地甚至可以是像“最近的咖啡店”这样模糊的表述。

Gemini会激活手机上的谷歌地图，在体验加载短暂延迟后，眼镜会显示逐向导航指示。当你向前看时，会显示你的下一个转弯信息。但如果你需要确定自己在空间中的方位，可以低头看地面，在地图上看到你的蓝点。你还可以左右转动身体来在空间中旋转，就像在手机上试图让蓝点指向正确的方向一样。然后当你再次抬起头时，可以继续行走，而不会被地图遮挡视线。由于该体验与手机上的谷歌地图绑定，像“家”和“公司”这样的已保存目的地将自动可用。

我们还得以短暂使用这款眼镜来识别视野中的各种物体并就它们提问。起初，眼镜难以识别我们面前架子上的一幅莫奈画作的复制品，这是因为原型机并未自动启用摄像头——必须从应用中再次开启。不过，即使在我们靠近并聚焦于左下角的莫奈签名之后，Gemini也是在回答了几个问题之后才说它看起来像是莫奈的作品。

其他测试则更为顺畅，眼镜立即识别出了架子上的植物，并回答了关于一本书中不同食谱的问题。不过，这些都是你今天可以用谷歌Lens（或聊天机器人应用中集成的其他AI模型）做到的事情，尽管我们认为能够不用掏出手机就完成这些操作还是很有趣的。谷歌表示，今年晚些时候，当其扩大可信测试者计划时，将分享更多关于其Android XR显示眼镜的信息。

与此同时，该公司认为音频眼镜足以满足部分用户的需求——考虑到尽管面临Meta和Snap在这一领域的竞争，其显示眼镜尚未准备就绪，这或许是一种巧妙的说法。与显示版本一样，音频眼镜也可访问谷歌的Gemini AI，你可以通过眼镜镜腿上的扬声器私密地听到它。你可以通过眼镜听音乐、按下按钮拍照、拨打电话或访问手机上的应用——就像未来的显示版本一样。

访问其他第三方应用不在我们的演示项目之列，但该眼镜将允许用户告诉Gemini执行诸如“从这个食谱中取出食材，添加到我的购物清单中”之类的操作。在谷歌大会主题演讲中展示的另一个例子中，眼镜可以看到佩戴者正在炉灶上烹饪的餐食，并就餐食提供反馈，比如肉是否已经完全熟透。

 用户评论

IT那些事
 347 成员 |  4465 话题
+我要提问 +随便写写

可能感兴趣的话题

AI狂飙的Spotify：在功能扩张中迷失初心

Meta悄然推出名为Forum的类Reddit新应用

智能戒指制造商Oura申请上市

特朗普移动证实其泄露了客户个人数据，包括电话号码和家庭住址