不要再混淆AI人工智能和生成人工智能GenAI


将人工智能与 ChatGPT 等生成式人工智能技术等同起来,就像是把树枝误认为整棵树一样。

介绍
在当今世界,人工智能已成为一个统称,几乎涵盖了所有能够实现智能的软件。就像最新的时尚潮流一样,将某样事物打上人工智能的烙印是让科技看起来更酷、更令人兴奋、更有价值的方式。

最近,在讨论 ChatGPT 等生成式 AI 技术时,它也成为了一个统称。如您所知,这些新的生成式 AI 技术已风靡全球。公司、媒体甚至日常对话都随意将这些技术归入更广泛的术语 AI 之下。

然而,至关重要的是要认识到,人工智能作为一个领域,远比生成式人工智能要全面得多,混淆两者可能会造成危害。

它为什么有害?

  1. 它混淆了公众对人工智能这一领域的认知。
  2. 这导致许多人高估了生成式人工智能工具的能力。我遇到过许多人认为这些工具可以而且 应该毫不费力地解决任何数据挑战。
  3. 当一切都被贴上人工智能的标签时,我们也很难理解这项技术到底是什么,以及我们真正要处理的复杂程度。
虽然现在许多人将生成式人工智能等同于人工智能,但该领域。生成式人工智能应该被视为一个分支……

人工智能(AI):
AI 是我们将要揭开神秘面纱的最广泛关键词。

人工智能让机器完成人类可以完成的智能任务。例如学习、推理、感知、决策等等。

当机器可以自动化、优化或提高某些人类任务的效率时,这可能是一个重大突破,因为:

  • 与人类完成的任务相比,计算机可以大规模且相对轻松地扩展
  • 计算机通常能够比人类更快、更精确、更一致地完成任务
  • 它可以让人们去做其他事情,而且往往更有价值
那么我们如何让机器做出决策呢?一种选择是硬编码一组规则供计算机操作,例如,如果一封电子邮件包含“恭喜,您中奖了”这句话,那么它就是垃圾邮件。或者你可以让人工智能从数据中学习自己的规则。这被称为机器学习。

机器学习(ML):
在 AI 中,有 ML。

ML 是让计算机从数据中学习。从某种意义上说,这比硬编码指令要好得多,因为:

  • 硬编码指令通常无法考虑数千或数百万种不同的场景,这严重限制了解决方案的灵活性以及它对边缘情况的推断能力
  • 机器学习可以根据属性的相对重要性或提供的预测信号,对许多属性进行适当的加权
  • 机器学习可以发现数据中复杂或违反直觉的结果,而这些结果不容易通过人工检查观察到
  • 随着情况的不断发展,机器学习解决方案可以自动适应,规则列表更容易过时
机器学习在商业应用中一直很受欢迎,用于解决分类和回归问题,它利用适量的特征 (X) 来最准确地预测我们关心的目标 (Y)。数据通常是结构化的(按行和列组织),可以轻松放入 Excel 表或关系数据库中。

一些流行的“传统”机器学习算法是线性回归、逻辑回归、随机森林和梯度增强机。

这些更传统的 ML 模型至今仍被广泛使用,因为它们擅长:

  • 即使数据量很小或中等,也能获得高度准确的预测,这样我们就可以做出正确的决策——比如预测车辆何时会发生故障,以便我们能够在故障发生之前进行维修
  • 传统的机器学习也可以用来了解与我们关心的事物相关的潜在因素——使用前面的例子,这可能是了解与我们的车辆故障相关的一些潜在因素
  • 这些模型有时也可以用来模拟或评估不同的假设情景
当数据量大且非结构化时,还有另一组算法更常用。非结构化意味着数据的格式不易放入 Excel 表或关系数据库表中。此类数据的一些示例可能是文本数据、图像数据、音频数据等。

此类数据中广泛使用的“非传统”算法被称为深度学习算法。

你可能已经注意到,生成式人工智能模型倾向于创建文本、图像、音频和视频内容......所以你可能知道我们要去哪里!

深度学习:
机器学习 (ML) 中包括深度学习 (Deep Learning)。

深度学习算法是一种具有多层(使其变得很深)的神经网络结构算法。基本上可以想象成一列节点,然后这些节点与第二层相连。然后第二层可以与第一层和第三层相连。依此类推。

除了结构和数学之外,你还需要了解深度学习的知识:

  • 当数据中存在复杂关系和高维度时,它往往会表现出色
  • 从头开始构建时,通常需要大量数据来学习
涉及文本、图像、音频的应用往往是高维的复杂关系。

因此,计算机视觉(图像应用的别称)、自然语言处理(文本应用的别称)等领域是深度学习目前提供最先进技术的领域。

只要输入一些数据,所有 ML 模型都可用于模拟或创建新的数据点。然而,当 ML 不仅用于创建一些预测概率或值,还用于创建新的文本、图像、音乐或视频内容时,事情就会变得非常有趣。这就是生成式人工智能。

生成式人工智能:
深度学习中存在生成性人工智能。

现在,我要指出一个细微差别,从技术上讲, 生成式人工智能不一定是深度学习算法。然而,现代解决方案确实使用了深度学习算法。因此,为了简单起见,让我们将人工智能流行语保留为瀑布式结构。

这是人工智能的一个分支,其区别在于算法的应用方式。生成式人工智能技术的效用来自于以文本、图像、音乐、视频等形式创建新数据。

如前所述,生成式人工智能使用深度学习算法,而不是上一节讨论的传统机器学习算法。

生成式人工智能的独特之处在于,其解决方案不仅仅能够创建准确的预测,还具有更多的实用性。

这些解决方案的实用性在于能够快速创建不存在的新的有趣的内容。

大语言模型(LLM):
在生成式人工智能中,是大模型 (LLM)。

LLM 是一种特定类型的生成式人工智能,专注于创建类似人类的文本。

这样说可能过于简单,但 LLM 的本质工作原理如下:

  1. 收集大量非结构化文本数据
  2. 将文本分解为标记,即将单词、单词部分和标点符号转换为唯一数字
  3. 训练人工智能算法来预测下一个最佳标记
  4. 该算法并不只是挑选出最可能的单个标记,而是从一组高度可能的标记中抽取,从而引入响应的可变性——就像人类可以用许多不同的方式来表达同一件事一样
  5. 最后,在 LLM 的案例中,该算法非常擅长预测下一个最佳标记,当将所有这些预测串联在一起时,它可以模仿人类的文本

在大多数生成式人工智能场景中,人们往往更喜欢一点点随机性和不可预测性,从而让响应变得独一无二。

聊天GPT:
最后,LLM 内有 ChatGPT。

ChatGPT 就像是大型语言模型中的 Kool-Aid 或 Kleenex。这个著名的版本真正让大型语言模型名声大噪。它还引发了人们对生成式人工智能技术的兴趣和投资激增。

ChatGPT3 于 2022 年 11 月 30 日推出。它真正代表了人工智能通过语言与人类互动方式的颠覆性重大飞跃。