经典频率统计和贝叶斯统计之间关系

经典频率统计和贝叶斯统计之间存在微妙关系,特别是在 p 值和贝叶斯后验的背景下。

关键点:

  1. 古典频率论者:
    • P 值: 在经典频率统计中,p 值通常用于评估反对原假设的证据。 p 值是对原假设证据强度的衡量。 p 值越小,表明反对原假设的证据就越有力。
    • 渐近性质:渐近是指样本量接近无穷大时的行为。统计检验的某些属性(例如检验统计量的正态性)随着样本量的增加而变得更加准确。
  • 贝叶斯方法:
    • 贝叶斯后验:在贝叶斯统计中,贝叶斯分析不是提供 p 值,而是生成后验分布,它表示在给定观测数据的情况下有关感兴趣参数的更新信念和先前的信念。后验分布是表示参数值不确定性的概率分布。
  • 等价(渐近):
    • 该声明表明,在某些条件下,对于经典频率论者来说,p 值可以渐近等价于贝叶斯后验。这意味着随着样本量变得非常大,p 值的行为可能会接近贝叶斯后验的行为。
  • 解读注意事项:
    • 声明中的警告是将 p 值解释为概率。在经典频率统计中,p 值不是直接概率。它是在原假设为真的假设下,观察到与观察到的统计量一样极端或更极端的检验统计量的概率。它不提供原假设为真或假的概率。

    渐近等价
    是指当样本量变得非常大时统计方法的行为。在某些情况下,在某些条件下,当使用非信息性或平坦先验时,经典推理方法(频率派方法)的结果可能会收敛到贝叶斯推理方法的结果。

    1. 模型和假设:等价性取决于具体的统计模型和假设。不同的模型可能表现出不同的行为。
    2. 平坦先验假设: 该语句假设在贝叶斯推理中使用平坦(非信息性)先验。虽然通常选择平坦先验是因为其简单性,但先验的选择会影响贝叶斯结果。在某些情况下,选择平坦先验可能并不合适,或者可能会导致不同的结论。
    3. 收敛: 渐近等价是指随着样本量的增加而收敛。实际上,样本量可能不够大,无法充分体现渐进特性。
    4. 推理类型:等价性可能适用于推理的某些方面(例如点估计),但不一定适用于所有方面(例如区间估计、假设检验)。

    量化交易
    对于经典频率论者来说,p值是渐近的,等价于贝叶斯后验,但它们不应该被解释为概率。

    这是因为在非平稳模型中等价性被打破。

    考虑数据的另一种方法是在给定p的观测值的情况下,观察ρ的分布:

    • - 使用p值作为概率的问题是,如果我们观察到p =0.95,我们可以拒绝p =0.9的null,但我们无法拒绝p =1的null
    • - 另一个问题是不相关信息造成的失真,其中p=1时p <0.95的值比p=0.9时p <0.95的值更有可能

    总结如下:

    • - 经典推断与使用平坦先验的贝叶斯推断是渐近等价的,但在市场上并非如此
    • - 处理单位根的典型方法隐含地做出了不可取的假设
    • - 机器学习系统将需要依赖于样本的先验,其对ρ的高值施加更多权重