通俗讲明白机器学习中的学习问题 - svpino

使用平白语言而不是复杂数学图表公式讲明白监督学习、无监督学习和强化学习、半监督学习、自主学习等关键区别。

监督学习
监督学习可能是我们都听说过的最常见的问题类别。我们从示例及其对应标签（或答案）的数据集开始，然后，我们训练一种模：在这些示例与相应标签之间的形成映射。目的是使模型从其所看到的示例中泛化（banq注：从具体看到普遍规律，中国人定义的归纳法），这样能在以后回答类似的问题。监督学习主要有两种类型：

分类：我们预测一个类别标签
回归：我们预测一个数字标签

监督学习的分类：指定一组包含狗图片及其相应品种的数据集，构建一个AI算法模型，该模型能在新图片发现狗品种。注意目标是如何预测类别标签（狗的品种）。
监督学习的回归：指定一组房屋的特征及其市场价值，构建一个确定新房屋价值的模型。注意目标是如何预测数字标签（房屋的价值）。

无监督学习
无监督学习是关于查找数据中的关系。此过程不涉及任何标签。我们不会通过带有标签的示例直接教授该算法。我们希望它可以从数据本身中学习。
无监督学习的示例：指定潜在客户列表，将其分为不同的细分组，以便您的营销部门可以与他们联系。在这里，算法将根据现有关系为您的客户确定不同的组。
聚类（Clustering）是无监督学习的最常见示例。您可能已经听说过k-Means是最流行的聚类算法之一。在此，“ k”代表我们要查找的聚类数。

强化学习
强化学习非常酷：代理与环境交互以收集奖励。基于这些观察，代理可以了解哪些操作将优化结果（最大化奖励或最小化惩罚）。
强化学习的示例：机器人通过步行并探索两个位置之间的不同路径来学习从仓库中的A点到B点的方式。每次机器人被卡住都会受到处罚。当达到目标时，就会得到回报。
AlphaZero（Chess）和AlphaGo（Go）可能是最受欢迎的两种强化学习实施方案。DeepMind是所有这项研究的公司。在他们的网站上查看一些非常酷的文章。

半监督学习
在半监督学习中，我们获得了很多数据，但只有很少的标签。有时，甚至我们拥有的标签也不完全正确。目标是建立一种解决方案，以利用我们拥有的所有数据，包括未标记的数据。
想象一下，您有大量的数据，但是其中大多数没有标签。更糟糕的是：进行标签会非常昂贵。假设我们要根据成熟度对视频进行分类。我们有数百万个标签，但只有少数几个带有标签。标记视频需要很长时间（您必须完整观看！）我们也不知道要建立一个好的模型需要多少个视频。在传统的监督方法中，我们别无选择：我们需要花费时间，并拿出一个带有标签的视频的大型数据集来训练我们的模型。但这并不总是一种选择。在某些情况下，这可能是项目的结束。
使用主动学习，我们可以让我们的算法开始使用已有的数据进行训练，并根据需要交互地请求新的标记数据。主动学习是一种半监督学习方法。
主动学习：该算法将查看所有未标记的数据，并将选择最有用的示例。然后，它将要求人们标记这些示例，并在培训过程中使用答案。
确定哪些示例最有用的是有问题的部分。更糟糕的是，我们可以随机选择未标记的示例，但这并不明智。选择过程越好，构建模型所需的数据就越少。
在决定时，我们希望算法为模型选择最具挑战性的示例。以下是一些可以进一步研究的现有方法：

-最低置信度不确定度
-最小保证金不确定度
-熵降低

总而言之，主动学习会反复训练模型，以最大程度地减少所需的标记数据量。这可以节省大量资金，有时，差异才使解决方案变得可行。

自我监督学习
自我监督学习是无监督学习的子集。这个想法是使用监督学习来解决一个任务（pretext任务），该任务以后可以用来解决原始问题。我们以可以利用现有标签的方式来构造问题。
自我监督学习问题的三个流行示例：

Autoencoders
变Transformers
生成性对抗网络

多实例学习
是“监督学习”的子集。此处的区别在于，我们没有为每个特定示例添加标签，而是为示例组添加了标签。这些组称为“袋bags.”。
多实例学习模型着重于根据袋子中包含的各个实例来预测袋子的类别。这种类型的问题的一个例子是基于内容的图像检索，我们的目标是基于其中包含的对象来查找图像。
每当遇到问题时，只要能够根据问题的特征识别其类型，就可以确定潜在的解决方案。这是理解这些类型的机器学习问题和可能的应用程序的价值。