通俗易懂讲解ML中的均方误差 (MSE) - haltakov

均方误差 (MSE)是用来测量预测值Ŷ与某些真实值匹配程度。MSE 通常用作回归问题的损失函数。例如，根据其属性估算公寓的价格。

详细公式解释
均方误差公式可以写成如下，它代表了一个非常简单的概念，但如果您刚开始使用 ML，可能不太容易读懂。

误差被定义为预测值Ŷ和一些真实值之间的差异Y。例如，如果您要预测房价，则误差可能是预测价格与实际价格之间的差异。

从标签中减去预测是行不通的。误差可能为负也可能为正，这是对样本求和时的问题。想象一下你对两套房子价格的预测是这样的：

House 1：实际 120K，预测 100K -> 错误 20K
House 2：实际 60K，预测 80K -> 误差 -20K

如果你总结这些错误将是 0，这显然是错误的。要解决这个问题，您可以取绝对值或误差的平方。正方形有一个特性，它惩罚更大的错误更多。使用绝对值将为我们提供另一个流行的公式 - 平均绝对误差。

我们通常计算多个样本的误差（在我们的例子中 - 房屋）。这是训练机器学习模型时的典型情况 - 您的批次中将有许多样本。我们需要计算每一个的误差并求和。同样，在这里让误差始终≥ 0 很重要。

如果要比较不同大小批次的误差，则需要对样本数量进行归一化——取平均值。例如，您可能想查看哪个批次大小产生的误差较小。

现在应该更容易理解公式了！MSE 是 ML 回归模型（例如线性回归）中常用的统计度量和损失函数。您还应该查看平均绝对误差 (MAE)，它可以更好地处理异常值。