• 为什么说Perplexity想取代Google几乎不可能?
  • 发布于 1个月前
  • 44 热度
    0 评论
AI 正逐步进入搜索业务领域。至少,我们目前了解到的情况是这样的。随着 Google 搜索体验日益不如以往,而像 ChatGPT、Google Gemini、Microsoft Copilot 这样的工具却在不断进步,我们似乎正迅速迈向一个新时代,在线获取和处理信息的方式正发生变化。Perplexity、You.com 等公司正在推出他们的下一代搜索产品,甚至 Google 和 Bing 也在大力投资,坚信 AI 是搜索领域的未来。传统的十个蓝色链接将成为历史,取而代之的是直接回答我们对这个世界各种奇怪问题的搜索结果。

然而,我们需要理解的是,搜索引擎功能极其丰富。虽然有人依靠 Google 来获取重要且不易获得的科学信息,但更多的人则用它来检查电子邮件、访问沃尔玛的官网,甚至回忆胡佛之前的美国总统是谁。有一个有趣的事实是,每年都有大量的人上 Google,然后在搜索框里输入 “google”。我们通常将 Google 视为研究工具,但实际上,它每天要应对数十亿次各式各样的搜索请求。

因此,对于所有渴望取代 Google 的公司来说,真正的挑战不在于它们检索信息的能力。关键在于它们能否像 Google 一样全面高效。基于这个考虑,我决定对一些最新的 AI 产品进行实际测试:我根据搜索引擎优化(SEO)研究公司 Ahrefs 提供的数据,收集了 Google 上搜索频率最高的问题和查询,并将它们输入到不同的 AI 工具中测试。在某些情况下,我发现基于 LLM 的机器人实际上比 Google 的搜索结果页面更有用。但在大多数情况下,我也看到了用任何技术(无论是 AI 还是其他)取代 Google 在网络中心的地位是多么的困难。

从事搜索行业的人士通常会说,基本上有三种类型的搜索查询。其中最常见和最受欢迎的是导航性查询,即用户输入某个网站的名称来访问该网站。在 Google 上的绝大多数顶级查询,从 “youtube” 到 “wordle” 再到 “yahoo mail”,都属于这种类型。实际上,这正是搜索引擎的主要职责:引导用户访问特定的网站。

在导航查询方面,AI 搜索引擎普遍不及 Google。当你在 Google 进行此类搜索时,几乎总能第一时间找到你所需的结果,当然,当你只是想直接访问 amazon.com 或类似网站时,Google 展示一系列其他结果似乎有些多余,但其快速而准确的特性不可否认。相比之下,AI 机器人倾向于先思考几秒钟,然后提供一些关于该公司的相关信息,而我实际上只需要一个直接链接。有些 AI 工具甚至连 amazon.com 的链接都没有提供。

我不是讨厌多余的信息,我真正不满的是这些 AI 工具需要花费很长时间才能满足我的需求。为了得到有关 Home Depot 的三段机器生成的文本而等待 10 秒钟,并非我所期望的;我只是需要一个直接访问 Home Depot 的链接。在这一点上,Google 一直是胜利者。

另一种极受欢迎的搜索类型是信息查询:你希望了解一些具体的信息,而这类信息通常有一个明确的答案。比如,“NFL 比分” 是一个热门的信息查询;“现在几点” 和 “天气” 也同样属于此类。不管谁来告诉你比分、时间或温度,这些都是你想要知道的信息。

在这方面,搜索结果差异较大。对于体育比分这类实时信息,AI 搜索引擎通常不太可靠:You.com 和 Perplexity 经常给出过时的信息,虽然 Copilot 大多数时候都能提供准确结果。而 Google 不仅能提供准确信息,还常常会展示一个包含其他统计数据和信息的小部件,这使得它的功能优于其他搜索引擎。同样,对于需要用户特定位置或上下文信息的查询 ——Google 可能已经掌握了这些关于你的信息,但大多数 AI 机器人则没有这些数据。

在处理像 “一年有多少周” 或 “母亲节是何时” 这类更常见的信息时,我测试的所有工具都给出了正确的答案。在很多情况下,我实际上更偏好 AI 给出的回答,它们提供了一些有帮助的背景信息。但我不确定这些答案的可信度有多高。例如,Google 告诉我一年有 52.1429 周,而 You.com 则解释说,实际上是 52 周加一天,而在闰年还会多一天。这比简单的 52.1429 更加有用!但 Perplexity 的回答却让人困惑,它先是告诉我普通年是 52 周,闰年是 52 周加一天,随后却在两句话之后自相矛盾。看看这个完整的回答,你或许可以尝试理解它:

普通年大约有 52 周,而闰年则有 52 周加 1 天。更精确地讲,一个常规年实际上是 52.143 周,这表示普通年多了一天。另一方面,闰年 —— 每四年出现一次,除了特定的例外,有 52 周加 2 天。周数的这种差异是由于普通年的额外一天和闰年二月中的附加一天造成的。

在更多的研究之后,我现在相信 You。com 给出的答案是正确的。但整个过程耗时太长,让我不得不去核实搜索结果,这与快速获得有用的概括性信息的初衷相悖。在这方面,Google 凭借其一个突出的特点继续保持领先:速度。

然而,在一种特定类型的信息查询中,情况恰恰相反。我称之为 “隐藏信息查询”。我能提供的一个极佳例子是广受欢迎的查询:“如何在 Mac 上截屏”。虽然互联网上有无数网页包含这一答案 —— 只需按下 Cmd-Shift-3 来截取整个屏幕,或 Cmd-Shift-4 来截取选定区域,你不用客气 —— 但这些信息通常被大量的广告和 SEO 内容所掩盖。包括 Google 自家的 Search Generative Experience 在内的所有 AI 工具,都能直接提取这些信息并直接呈现给用户。这确实很棒!

这是否暗示着这些查询背后存在复杂的问题,可能对网络的商业模式和结构构成威胁?确实如此!但从纯粹的搜索体验角度来看,它显著优于以往。在询问食材替代品、咖啡比例、耳机防水等级等容易理解却难以寻找的信息时,我也得到了相似的结果。

这引出了 Google 搜索的第三类:探索性查询。这类问题没有唯一的答案,更像是一段学习旅程的起点。在最受欢迎的查询列表中,诸如 “如何打领带”、“电锯为何被发明” 和 “TikTok 是什么” 之类的问题,都属于探索性查询。如果你曾经 Google 过你刚了解的音乐家的名字,或者搜索过 “蒙大拿州海伦娜有什么好玩的” 或 “NASA 历史” 等,那你就在进行探索。根据排名,这些并非人们主要使用 Google 进行的搜索类型。但在这些时刻,AI 搜索引擎则有机会大放异彩。

例如,为什么会发明电锯呢?Copilot 给出了一个关于其医学起源的多层次答案,接着阐述了它们的技术演变和最终被伐木工使用。它还提供了八个相当有用的链接供进一步阅读。Perplexity 则给出了一个更简短的回答,但同样包含了一些古老电锯的酷炫图片和一个关于该主题的 YouTube 解析视频链接。Google 的搜索结果包含了许多相同的链接,但却没有为我做任何综合性解读。即便是它的生成式搜索也只给出了非常基本的信息。

我对 AI 引擎最赞赏的一点是它们提供的引用信息。Perplexity、You.com 等平台正在逐步改进将引用链接到其来源的方式,通常是以内联形式呈现,这意味着当我遇到一个特别能激起我兴趣的事时,我可以直接访问原始来源。尽管它们并不总是提供足够的来源,或总是将它们放置在恰当的位置,但这无疑是一个积极且有益的发展趋势。

在进行这些测试时,我遇到的最让人关注的体验之一,是对一个看似简单的问题的探索:“看什么”。Google 为此设计了一个特别的页面,展示了从《沙丘:第二部分》到《虚构》等 “顶级推荐” 电影的海报;“为你推荐” 部分,对我来说则包括了《死侍》和《停摆》;还有流行影片和按类型排序的选择。

而各 AI 搜索引擎则未能达到这一效果:Copilot 列出了五部热门电影;Perplexity 提供了从《Girls5eva》到《追捕》再到《将军》的一系列看似随机的选择;You.com 则给出了一些过时的信息,推荐我观看 “Netflix 最佳 14 部原创电影”,却并未列出具体电影。

在这种情况下,AI 确实是个不错的选择 —— 我所需要的不是一堆链接,而是对我的问题的直接回答 —— 但聊天机器人并非最佳的交互界面。同样的,搜索结果页面也不是最佳选择!显然,Google 意识到这是平台上最常被问到的问题,并已设计出一个更加有效的解决方案。

从某种角度来看,这恰好总结了当前的状态。至少对于某些网络搜索,生成式 AI 可能比过去几十年的搜索技术要更为高效。但现代搜索引擎不只是链接的集合。它们更像是微型操作系统,能够直接回答问题,内置有计算器、转换器、航班选择器等各种工具,只需简单点击一两下,就能引导你到达目的地。根据这些数据,大多数搜索查询的目标并非开启一段信息探索之旅,而是快速获取一个链接或答案,然后立即退出。目前,这些基于 LLM 的系统还是太慢,难以与之竞争。

我认为,最关键的问题不仅仅在于技术,更在于产品设计。包括 Google 在内的每家公司都相信,AI 可以帮助搜索引擎更好地理解问题并处理信息,这已是行业共识。但 Google 能否在 AI 公司将聊天机器人转变为更加复杂、多功能的工具之前,重新设计其结果页面、商业模式以及信息呈现、总结和展示的方式?十个蓝色链接不再是搜索的终点,一个全能的文本框也不是解决方案。搜索无处不在,一切都与搜索相关。要击败 Google,光靠一个聊天机器人远远不够。
用户评论