• 若干年以后 人们是否会怀念2023年这个AI元年?
  • 发布于 2个月前
  • 145 热度
    0 评论
一年多前,当 OpenAI 推出 ChatGPT 后,人们开始真切感受到 AI 的潜力和风险。ChatGPT 是一款独特的应用程序,它允许用户以极其人性化的方式与电脑对话。发布仅五天,用户数就达到了一百万。两个月后,每月活跃用户量突破了一亿,现在这个数字几乎要翻倍了。这一年,许多人开始学习如何与机器人沟通、创造、作弊与合作。

紧随 ChatGPT 之后,谷歌发布了自家的聊天机器人 Bard;微软将 OpenAI 的模型融入了其 Bing 搜索引擎;Meta 推出了 LLaMA;Anthropic 则推出了 Claude,这是一款适用于各种规模任务的 “下一代 AI 助手”。这时,互联网似乎变得生机勃勃。

AI 并非新鲜事物:它已经是我们日常生活的一部分,以至于我们几乎察觉不到 Netflix 推荐电影、信用卡公司自动检测欺诈行为,或 Amazon 的 Alexa 播报早间新闻时用到了 AI。

然而,这些 AI 通常在幕后以固定且脆弱的方式运作,而聊天机器人则反应灵敏有即兴创作能力。它们的不可预测性更加引人注目。当我们向它们求助,提出一些我们不了解的问题,或寻求创意帮助时,它们常常能创造出前所未有的内容,仿佛凭空变出。

诗歌、文学综述、论文、研究报告,乃至三幕剧本,都以清晰简单的人类语言呈现,就像是机器中的神被赋予了我们的形象。比如,让 ChatGPT 用 Johnny Cash 的风格写一首关于自动驾驶汽车的歌,你可能会得到这样的歌词:
Ridin’solo, but I’m never alone,(独行却不孤单,)
Got my AI ridin’shotgun, steady as a stone.(我的 AI 驾驭副驾,稳如磐石。)
On the endless road, under the sky so vast,(在无尽的路途上,天空辽阔无垠,)
A ghost driver at the wheel, footprints of the past.(幽灵驾驶者掌舵,留下过去的足迹。)

如果要求它用 Giuseppe Verdi 的风格写歌,ChatGPT 则描绘了这样一个场景,一位男高音歌唱:
Ecco la carrozza senza cavallo!(瞧,那马车无需马匹!)
Scivola nella notte, silenziosa come il fato.(它静悄悄地滑过夜晚,如命运般沉默。)
L’ingegno dell’uomo, l’orgoglio del progresso,(人类的智慧,进步的骄傲,)
In questa danza d’acciaio, tessiamo il nostro destino.(在这钢铁之舞中,我们编织着我们的命运。)

尽管到目前为止,它们不太可能获得许多奖项,但像 ChatGPT 这样的聊天机器人已经使我们的智能设备相形见绌。它们不仅精通多种外语和编程语言,还能快速概述复杂的法律和财务文件,开始诊断医疗状况,甚至能在不学习的情况下通过律师考试。

另一方面,我们可能误以为这些 AI 模型真正具有智能,理解它们传递的内容及其含义和影响。事实并非如此。正如语言学家 Emily Bender 和三位合著者所言,它们更像是 “随机复读机”。不容忽视的是,在 AI 被认为具有智能之前,它需要吸收大量人类智慧。而在我们学会与机器人合作之前,机器人也必须学会如何与我们相处。

为了理解这些聊天机器人的工作原理,我们不得不学习新的术语,如 “大语言模型(LLM)”、“神经网络”、“自然语言处理(NLP)” 和 “生成式 AI”。目前我们大致了解,这些聊天机器人通过一种模仿人脑的机器学习方法分析了互联网上的大量信息,并根据词语和短语的常见组合方式,以统计学方法拼接文字。然而,AI 的创新能力依然有很大部分是我们难以理解的,特别是当聊天机器人出现 “幻觉” 时。

例如,谷歌的 Bard 创造了关于 James Webb 望远镜的错误信息,微软的必应则编撰了歌手 Billie Eilish 在 2023 年超级碗中场秀上表演。一位律师表示自己未曾想到 ChatGPT 会编造案件,他的联邦法庭陈述中就充斥着 ChatGPT 提供的虚假引用和捏造的法官意见。(法庭对此处以五千美元的罚款。)

ChatGPT 在细则中承认可能会出错:“ChatGPT 可能会犯错。请在重要情况下核对信息。” 令人惊讶的是,最近的研究显示,在过去一年中,ChatGPT 在执行某些任务时的准确性下降了。研究人员认为这可能与其训练所用的材料有关,但由于 OpenAI 不愿公开其训练 LLM 所用的材料,所以这只是推测。

高中生和大学生热衷于使用聊天机器人,即便他们知道这些机器人可能会犯错。他们利用聊天机器人进行论文研究、解答数学题和编程。(去年五月期末考试周,我有个学生发现图书馆里几乎每台电脑都打开了 ChatGPT。)根据最近一项 Junior Achievement 的调查,超过半数的年轻人认为使用聊天机器人来完成学业是作弊,但仍有将近半数的学生表示他们可能会使用这一工具。

学校管理者们对此亦存争议,难以确定聊天机器人是欺骗的工具还是学习的助手。今年一月,纽约市学校总监 David Banks 禁止了 ChatGPT 的使用,称其 “无法培养批判性思维和解决问题的技能”,这些能力对学术和终身成功至关重要。四个月后,Banks 撤回了禁令,批评这一决定是草率和恐惧驱动的,忽略了生成式 AI 在支持学生和教师方面的潜力,以及我们的学生正活跃于一个需要理解生成式 AI 的世界。

此外,德克萨斯 A&M 大学有位教授尝试使用 ChatGPT 查出用它作弊的学生。当 ChatGPT 判定全班学生都作弊后,这位教授威胁要让全班挂科。但问题是,ChatGPT 出现了误判。(目前,利用 AI 检测作弊正在成为一种增长的行业。)从某种角度看,我们都像那位教授,对那些我们可能高估、误解或根本不理解的产品进行实验。

AI 已被应用于生成财务报告、广告文案和体育新闻。OpenAI 联合创始人兼总裁 Greg Brockman 在三月份预测,未来聊天机器人还将帮助编写电影剧本,甚至重写观众不喜欢的场景。两个月后,美国编剧工会因担心糟糕的 AI 生成电影而发起罢工,要求签订一份保护创意不受侵害的声明。他们认为,任何在众多人类领域能制作出可信作品的 AI 平台,可能对创造力本身构成威胁。

九月份,当编剧们在五个月罢工后与工作室协商达成协议,决定放弃 AI 编写的剧本时,作家协会和一些著名小说家联合对 OpenAI 提起了集体诉讼。他们指控 OpenAI 在搜集网络内容时,未经许可或补偿就使用了他们受版权保护的作品。

由于 OpenAI 对其训练数据的分享政策并不透明,尽管作家们无法确定自己的书籍是否被挪用,但他们指出,早期的 ChatGPT 曾能就特定书籍提供逐字引用,这 “暗示底层的 LLM 可能完整地吸收了这些书籍。”(如今,ChatGPT 已被重新训练,以回应 “我不能提供受版权保护文本的逐字摘录。”)目前,一些企业甚至在销售提示,帮助用户模仿著名作家。而可以轻易被模仿的作家可能失去其价值。

七月份,文学非营利组织美国笔会(Pen America)的报告指出,生成式 AI(Generative AI)通过加快传播虚假信息和网络滥用,威胁着言论自由。“报告还提到,这可能导致人们对语言乃至彼此失去信任。” 这些风险已经超越了书面文字的范畴。

OpenAI 推出的 DALL-E 2 引擎,能将文本转化为人工图像;不久后,Stability AI 也发布了类似工具 Stable Diffusion。艺术探索与报道中心认为,AI 生成的艺术作品是 “像吸血鬼一样,吞噬前代艺术”,可以说是 “历史上最大的艺术盗窃案”。

虽然以这种方式创作 “艺术” 既有趣又神奇,尤其对艺术技能不足的人来说,但那些逼真的、未曾发生事件的场景图像也对真实性构成了威胁。任何人都可以让 AI 智能体生成填塞投票箱的人或抗议者与警察对峙的图像(我亲自尝试过,结果相当逼真)。

目前虽然在努力为 AI 生成的图像添加水印,但研究人员还未能开发出不会被常用工具破解的水印系统;他们甚至能在真实图像上添加假水印。OpenAI 目前仍然允许用户自由去除水印。

三月份,包括 Elon Musk 和苹果联合创始人 Steve Wozniak 在内的超过一千名技术专家签署了一封公开信,呼吁 AI 公司暂停六个月对其最先进技术的研发,以便留出时间进行监管。信件部分内容如下:

我们真的应该任由机器在信息渠道中散播宣传和不实信息吗?我们应该让所有工作,包括那些有成就感的工作,都被自动化吗?我们应该培养出可能最终比我们更聪明、淘汰我们、取代我们的非人类智能吗?我们愿意冒失去文明控制的风险吗?这些决策不应被交给非民选的科技领袖。

这些担忧并非杞人忧天。例如,IBM 的研究团队只用五分钟就让 ChatGPT 编写了极具说服力的网络钓鱼邮件。其他研究者也利用生成式 AI 编写了能绕过安全协议的恶意软件,成为网络犯罪份子的潜在使用工具。高盛预测,AI 可能很快将取代三亿个全职岗位。

不出所料,研发并没有暂停,也没有出台有意义的监管措施。相反,十月底,拜登政府发布了一份关于 “AI 的安全、可靠和值得信赖的发展与使用” 的行政命令,这更像是一份愿望清单而非具体命令的冗长文件。这反映了行政部门在 AI 的风险与机遇之间的复杂权衡。

仅一周后,OpenAI 就宣布推出一系列新产品,包括能读取长达三百页书籍的 AI 模型、一个自制聊天机器人套件,以及一项名为 “版权保护盾” 的服务,承诺为被指控版权侵犯的开发者支付法律费用。

通过这些新工具,我利用 ChatGPT 创建了两款聊天机器人:一款能判断哪些药物不宜共服,另一款能列出特定地区能适应特定食物过敏和禁忌的餐厅。这些聊天机器人的制作直观简单,但我对它们背后的算法、训练数据的来源一无所知 —— 我是否违反了版权?这些机器人提供的信息是否准确也是个问号。我也不清楚自己使用了多少计算资源,以及可能造成的环境影响。不过,它们确实很酷,可能是人们愿意付费的东西。

生成式 AI 的商业发展似乎会持续火热。AI 将日益影响更多复杂领域,如放射学、药物研发、心理治疗、招聘以及大学录取。各大公司将把它融入下一代硬件产品。比如,三星很可能在其明年一月推出的新旗舰手机中整合生成式 AI。OpenAI 联合创始人 Sam Altman 在短暂离开后重返 CEO 职位,据悉他正在与苹果的知名设计师 Jony Ive 合作,打造一款被称为 “AI 领域的 iPhone” 的产品。

几年之后我们可能会怀念 2023 年,那是一个智能还未成为商品化产品的时代。
用户评论