一幅图片胜过1000个单词。有关概率和统计信息的直观介绍,请查看“ Seeing Theory”。这个交互式网站将带您了解机器学习中所需的许多概念。适合菜鸟入门学习,捷径学习路线,有中文,点击标题。
为帮助无法访问原网址用户了解,转载基本概念如下:
第一章 基础概率论
本章将介绍概率论的一些基本概念
- 概率事件
以一个投掷一枚公平的硬币(出现正面和反面的概率相等,均为1/2)的经典的概率实验为例:。在现实中,如果我们重复抛一枚硬币,出现正面的频率可能不会恰好是50%。但是当抛硬币的次数增加时,出现正面的概率会越来越接近50%。
如果硬币两面的重量不一样, 出现正面的概率就和出现反面的概率不一样了。
- 期望
现在以另一个经典的概率实验为例:扔一枚公平的骰子,每一面出现的概率相等,均为1/6。当试验的次数越来越多时,扔出的结果的平均值慢慢趋向于它的期望3.5。
- 方差
Var(X)=E[(X−E[X])2]
随机从下面十张牌中抽牌。当抽取的次数越来越多时,可以观察到样本平方差的平均值(绿色)逐渐趋向于它的方差(蓝色)。
第二章 进阶概率论
本章将进一步介绍概率论中的一些核心知识。
- 集合论
- 古典概型
- 条件概率
数学上,条件概率的计算一般会把的样本空间缩小到一个我们已知信息的事件。再以之前举的下雨为例,我们现在只考虑所有前一天多云的日子,而不是考虑所有的日子。然后我们确定在这些天中有多少天下雨,这些下雨天数在所有我们考虑的天数中的比例即为条件概率。
第三章 概率分布
概率分布描述了随机变量取值的规律。
- 随机变量
- 离散型和连续型随机变量
P(X=x)=f(x) |
则称XX是一个离散型随机变量。
- 中心极限定理
第四章 统计推断:频率学派
频率学派通过观察数据来确定背后的概率分布。
- 点估计
- 置信区间
- Bootstrap方法
第五章 统计推断:贝叶斯学派
贝叶斯学派的思想是用数据来更新特定假设的概率。
- 贝叶斯公式
P(患病|阳性)=P(阳性|患病)P(患病)/P(阳性) |
从上述公式我们可以看出,已知检查结果阳性患病的后验还依赖于概率患病的先验概率P(患病)。我们可以把这个患病的先验概率理解为人群中患有这个疾病的概率。
另一方面,后验概率还依赖于检查的准确程度:一个健康的人收到阴性结果的概率是多少?一个患者收到阳性结果的概率是多少?
最后,我们还需要知道这个检查给出阳性结果的总概率。
- 似然函数
L(θ|x)=P(x|θ) |
似然函数的概念在频率学派和贝叶斯学派中都有重要的作用。
- 从先验概率到后验概率
第六章 回归分析
回归分析是一种建立两个变量之间线性模型的方法
- 最小二乘法
- 相关性
- 方差分析