什么是检查悖论?


当一个人进入人群进行所谓科学随机的检查抽查时,他以为他得到了科学客观的结论,其实他没有考虑到自己的介入导致结果的不正确性,量子力学的薛定谔猫定理也大概是这个意思,这篇文章列举了大量这种检查悖论的现象:

一个常见的例子是班级人员数量的明显矛盾。假设你问大学生他们的班有多少人并且平均回答,结果可能是56人,但是如果你问学校的班级平均规模,他们可能会说31人。听起来有人说谎,但他们都可能是正确的。
出现这个问题的原因在于,当你对学生进行调查时,你会对大型课程进行过度抽样。如果一个班级中有10名学生,则有10次机会对该班级进行抽样。如果有100名学生,则有100个机会。
这不一定是个错误。如果你想量化学生的体验,那么学生之间的平均水平可能比整个班级的平均水平更有意义。但你必须清楚自己测量的内容以及报告方式。

同样的效果适用于客机。航空公司抱怨他们正在赔钱,因为很多航班几乎都是空的。与此同时,乘客抱怨飞机太悲惨,因为飞机太满了。他们都可能是对的。当航班几乎空无一人时,只有少数乘客可以享受额外的空间。但是当航班满载时,许多乘客都会感到紧张。

一旦你注意到检查悖论,你不需要出租时就会到处看到它,但是当你需要一辆出租车好像总是无法打到的士?部分问题是,当出租车过剩时,只有少数客户喜欢它。当缺货时,很多人都会感到痛苦。

另一个例子发生在等待公共交通时。公交车和火车应该以固定的间隔到达,但实际上有些间隔比其他间隔长。看你的运气,你可能会认为你很有可能会等待很长一段时间才能等到公交,结果证明你是对的:随机到达的概念在很长的时间间隔内更有可能下降,因为它会更长。

在社交网络的背景下出现了长尾分布的一个例子。1991年,斯科特费尔德提出了“友谊悖论”:观察到大多数人比他们的朋友拥有较少的朋友。他研究过现实生活中的朋友,但同样的效果出现在在线网络中:如果你选择一个随机的Facebook用户,然后随机选择他们的一个朋友,那么这个朋友有更多更多朋友的概念大约是80%。
友谊悖论是检验悖论的一种形式。当您选择随机用户时,每个用户都具有相同的可能性。但是当你选择他们的朋友时,你更有可能选择了有很多朋友的人。具体来说,有x个朋友的人超过了x 因子。

检查悖论的一些例子更加微妙。当我在新罕布什尔州进行209英里的接力赛时,其中一个发生在我身上。我为我的团队跑了第六条圈,所以当我开始跑步时,我跳进了比赛的中间位置。几英里之后,我注意到一些不寻常的事情:当我超过慢跑者时,他们通常要慢得多; 当更快的跑步者通过我时,他们通常要快得多。

起初我认为跑步者的分布是双峰的,有很多慢跑者,很多跑步者,以及很少像我这样的跑步者。然后我意识到我被检查悖论所迷惑。

在许多长距离接力比赛中,赛队在不同的时间开始,而大多数赛队包括更快和更慢的跑步者。结果,不同速度的跑步者最终在整个过程中分散; 如果你站在随机的地方并看着跑步者经过,你会看到几乎有代表性的速度样本。但如果你跳到中间的比赛,你看到的样本取决于你的速度。

无论你跑得多快,你都有可能通过非常慢的跑步者,更有可能被快跑选手超越,并且不太可能看到任何人以与你相同的速度跑。看到另一个跑步者的机会与你的速度与他们的速度之间的差异成正比。

这些例子表明,检查悖论出现在许多领域,有时以微妙的方式出现。如果您不了解它,可能会导致统计错误并导致无效推断。但在许多情况下,它可以避免,甚至故意用作实验设计的一部分。