当前位置:首页 > 经验分享 > 正文

什么是对话式人工智能?它是如何工作的?

  

  Kaitlyn Cimino / Android Authority

  当Siri和谷歌助手等数字助理在2010年代首次亮相时,它们理解自然语言的能力被誉为一场革命。然而,近十年后,它们的光环已经褪去,ChatGPT等对话式人工智能平台取而代之。他们可以理解一般的语言,包括俚语,而不需要你每次都鹦鹉学舌。但是对话式人工智能到底是什么意思,底层技术是如何工作的呢?让我们来分析一下。

  Google IO 2023 search generative ai 7

  对话式人工智能是自然语言处理(NLP)技术的最新进展,得益于谷歌和OpenAI等公司在机器学习方面的新突破。几十年来,研究人员一直试图教计算机如何复制人类语言,近年来,这些努力的速度显著加快。例如,像ChatGPT这样的现代聊天机器人可以用不同的语言风格理解和谈论各种主题。

  现代对话式人工智能的核心是最先进的大型语言模型。这些是在大型数据集上训练过的机器学习模型,包括来自书籍、维基百科甚至社交媒体平台的文本。随着训练的进行,该模型识别文本中的模式,并形成单词和句子之间的关系。这不仅可以让模型理解对话,还可以生成以前从未遇到过的全新文本。

  有限公司会话人工智能指的是能够理解并回应细微的人类对话的高级模型。

  对话式人工智能也不仅仅局限于书面文字。我们现在有了令人信服的语音引擎,它可以读取人工智能生成的具有近乎完美的语调、语气和情感的文本。例如,我最近写了一篇关于ChatGPT语音聊天模式的文章,以及它通过添加停顿和犹豫的声音来听起来像人类的能力。

  到目前为止,我已经多次提到ChatGPT,主要是因为它是当今最知名的会话AI。ChatGPT使用GPT-3.5或GPT-4的一个略有不同的版本,专门针对模拟人类对话进行了微调。换句话说,ChatGPT本身就是一个会话人工智能的例子,但它的底层语言模型并不一定配得上同样的头衔。

  ChatGPT Diagram

  2017年,谷歌的一组研究人员发表了一篇题为《注意力就是你所需要的一切》的论文。在论文中,他们提出了一种名为Transformer的新颖神经网络架构,该架构允许自然语言模型选择性地关注句子的关键部分,以理解上下文、情感和文本样本的更大含义。早期的架构不能以同样的方式连接单词和句子,这就是为什么它们不能很好地理解或复制人类的语言。

  今天,Transformer体系结构构成了大多数大型语言模型(llm)的主干。这些模型是在千兆字节的文本上进行训练的,这些文本是从互联网的各个角落收集来的,以理解人类是如何造句的。

  ChatGPT的创造者OpenAI将Transformer架构向前推进了一步,并采用了一种名为“人类反馈强化学习”的技术(见上图)。它本质上是雇佣人类对数千个文本样本进行评级,最终训练人工智能听起来更自然。如果您在使用ChatGPT时为回复投赞成票或反对票,您也可以参与这个评级过程。

  大多数公司对话式人工智能依靠人类来评估他们的反应在他们的培训过程中。

  谷歌也使用了类似的基于人类的方法来训练它的对话式人工智能产品,比如巴德。在关于PaLM 2语言模型的报告中,该公司表示,“工人的小时工资取决于完成判断的速度。大多数评价员的时薪在0.90美元(每分钟1条评论)至5.40美元(每分钟6条评论)之间,这与大多数评价员所在地理区域的典型时薪一致。”如果你想了解现代人工智能系统是如何训练和调整的,我建议你阅读完整的报告。

  Siri versus ChatGPT

  Robert Triggs / Android Authority

  除了对话式人工智能,你可能还会遇到聊天机器人和生成式人工智能等术语。这些术语之间没有明确的界限,你甚至可能会注意到它们有很大程度的重叠。

  让我们从聊天机器人开始,这是三个术语中最古老的一个。早期的聊天机器人基于一种非常基本的基于规则的机制工作。你需要输入一些预编程的响应,并尝试捕捉所有可能的命令。然而,传统的聊天机器人在面对一个独特的问题或看不见的命令时几乎总是失败。在与谷歌助手或alexa智能音箱互动时,你可能会遇到这种挫折。

  接下来是对话式人工智能,这个术语用来描述最先进的聊天机器人,它们可以对几乎任何人类对话做出回应。它不需要预先编程来模拟对话,因为它已经学会了理解上下文并以现实的方式做出回应。

  生成式人工智能构成了许多公司的支柱对话式人工智能平台,但它还有更多的功能。

  最后,我们有生成式人工智能。它是许多现代会话人工智能服务的基础技术。该术语描述的是可以生成从文本到图像甚至声音等不同类型内容的人工智能。Midjourney和Bing Image Creator是生成式人工智能的例子,因为它们可以创建以前从未存在过的完整图像。

  简而言之,像ChatGPT这样的对话式人工智能可能同时属于聊天机器人和生成式人工智能的范畴。然而,像Alexa这样更初级的聊天机器人没有任何内置的生成功能,可能也配不上会话人工智能的称号。

  与任何新兴技术一样,对话式人工智能也有其优点和缺点。以下是其中一些:

  效率想象一下卸载像文档这样的任务向聊天机器人发送文件或会议摘要。使用有限公司对话式和生成式人工智能,我们都可以腾出时间来处理真正重要的任务。

  按需帮助:有限公司会话式人工智能可以帮助完成一些平凡的任务,比如编写样板代码,甚至是现实世界的工作——想象一下,当你被困在某个地方时,你会请求帮助更换汽车轮胎e. A。会话人工智能可以用简单的英语引导你完成步骤,并回答你在此过程中可能遇到的任何意想不到的问题。

  偏见:根据数据集,co对话式人工智能可以通过模仿刻板印象或支持某些意识形态来放大种族或性别偏见。这些通常是无意的,但在任何针对各种主题进行训练的AI系统中都是不可避免的。

  错误信息在发布的最初几周内,ChatGPT和必应聊天响应迅速以编造的信息结尾。这种现象被称为幻觉,这是一个0在生成人工智能领域的持续挑战。

  ChatGPT stock photo 73

  Calvin Wankhede / Android Authority

  最近,我们见证了对话式人工智能的爆炸式增长,这意味着我们现在有许多服务可供选择。有些人像人类一样擅长解决问题和发现事实,而另一些人则把自己限制在充当创造性伴侣的角色。考虑到这种多样性,这里有一些你今天可以使用的对话式人工智能服务的例子:

  ChatGPTOpenAI无疑开启了围绕co的炒作在2022年底,ChatGPT开放了对聊天机器人的访问。大多数服务低于0只对公众开放作为回应到ChatGPT。

  谷歌吟游诗人在ChatGPT发布后,谷歌迅速采取了行动,并于2023年初向全世界推出了巴德。它使用搜索巨头谷歌自己的Gemini语言模型,而不是GPT,后者在对话方面也进行了类似的微调。我人我最终发现巴德在创造性任务中表现良好,但当被问及一个问题时,他往往会犯事实性错误关于复杂的话题。

  的性格。人工智能不像其他公司对话人工智能服务在这个列表上,字符。人工智能可以让你模拟与名人聊天。这意味着你可以和imperso聊天像埃隆·马斯克这样的现实世界名人的国家,或者把漫画书中的人物栩栩如生。

  克劳德。Claude是由前openai研究人员开发的,它是一个优先考虑安全和安全的人工智能助手巢响应鼻息高于一切。它是在一个较小的、经过审查的数据集上进行训练的,以减少偏差和不安全反应的可能性。

  微软Copilot:与ChatGPT建立在相同的基础上,你会发现Copilot已经融入了微软的各种产品,比如Windows 11和必应。它还能够在互联网上搜索新信息,生成或分析图像。

  毫无疑问,在未来的几个月和几年里,我们将看到更多的对话式人工智能服务。例如,谷歌的“巴德助手”(Assistant with Bard)将传统的聊天机器人体验与生成式人工智能相结合。以目前的创新速度,这项技术可能很快就会成为我们日常生活中不可或缺的一部分。

  是的,ChatGPT是会话式人工智能的一个例子——它可以理解复杂句子中的细微差别,并以类似人类的方式做出回应。

  对话式人工智能对很多人来说都很重要,因为它就像一个为你的特定需求和任务量身定制的私人助理。你可以把对话式人工智能对文化的影响等同于早期的计算器,它自动化了简单的计算,把我们解放出来处理其他任务。

  会话式人工智能服务通常在非常大的数据集上进行训练,这些数据集可能包括数千本书、维基百科(Wikipedia)等整个网站,甚至Twitter和Reddit等社交媒体提要。这使得人工智能能够了解不同的主题,并以不同的语气做出反应。

有话要说...