通俗易懂解释什么是PCIA(主成分分析) - stackexchange


假设我们的桌子上放着一些酒瓶。我们可以通过颜色、酒度、酒龄等来描述每种酒,而对于酒窖中每种葡萄酒如果用这些不同特征组成完整的清单。其中很多相关属性将是多余的。如果可以,我们应该可以用较少的特征来总结每种葡萄酒!这就是 PCA 所做的。
PCA 不是选择某些特征而丢弃其他特征。相反,它构建了一些新的特征,结果很好地总结了我们的葡萄酒清单。当然,这些新特征是利用旧特征构建的;例如,一个新的特征可能被计算为葡萄酒年龄减去葡萄酒酸度或其他类似的组合(我们称之为线性组合)。
事实上,PCA 会找到最好的特性,这些特性总结了葡萄酒列表以及唯一可能的特性(在所有可能的线性组合中)。这就是它如此有用的原因。

  1. PCA 寻找在不同葡萄酒中表现出尽可能多差异的特性。
  2. PCA 寻找允许尽可能好地重建原始特征的属性。