辛普森悖论的案例解析 辛普森悖论是什么意思
2023-05-19 12:06:44在世界十大悖论中,辛普森悖论是统计学中最经典的,但是相比于节俭悖论和说谎者悖论而言,却是比较抽象的,原因是辛普森悖论研究的对象,可能具有一定的相关性,但是也可能毫无关系,那么究竟是什么辛普森悖论呢?我们一起来了解一下。
辛普森悖论是什么
所谓辛普森悖论,其实就是在某个条件下的两组数据,如果分开来研究都很正常也会满足某种性质,但是如果将它们综合在一起来考虑,就会出现结果相反的情况,而这种情况也被称之为辛普森悖论,比如新生录取率与性格两个变量放在一起研究的时候,就会出现这样的问题。
所谓辛普森悖论实际就是指在单独比较的时候可能占优势的一方,却在最后的总体比较中反而称了弱势,这与人们平常的认知是相违背的,而这个现象其实在现实中是比较普遍的,但是它的存在也是合理的。
辛普森悖论的案例
最常见的辛普森悖论的案例就发生在大学的男女比例问题上,比如两所大学A和B,在物理学院方面,A大学男女比例大于B大学;在数学院方面,A大学的男女比例还是大于B大学,其他所有专业A大学的男女比例都比B大学要高,于是有人可能会认为A大学的男女比例肯定比B大学要高,然而事实却并非如此。
事实是A大学的男女总比例是比B大学低的,这是有人就可能产生疑问了,不是A大学所有专业男女比例都比B大学高吗,为什么总比例反而低呢?原因就是辛普森悖论的在作怪,我们可以下面数据中发现B大学的男女比例确实比A大学要高。
数据比较:
物理院 男生人数 女生人数 男:女
A大学 45 8 5.6:1(大)
B大学 101 51 2.0:1
数学院 男生人数 女生人数 男:女
A大学 50 201 0.25:1(大)
B大学 9 92 0.10:1
总体 男生人数 女生人数 男:女
A大学 95 209 0.45:1
B大学 110 143 0.77:1(大)
辛普森悖论的产生原因
为什么会产生辛普森悖论呢?这是我们需要思考的问题,实际上这是因为在统计的时候,两组数据的权重是有分别的,因此在最后统计的时候,应该以一定的系数去消除每组数据之间的差异,就比如A大学和B大学中,物理院和数学院的数据权重就不一样。
很明显物理院的男女比例数据要比数学院的权重要低,所以我们在选择大学的时候不能只看某个学院的男女比例,而需要避开辛普森悖论而去看总体的男女比例,当然总体男女人数也是我们可以考虑的。
辛普森悖论管理应用
辛普森最为明显的运用就是在考察两者实力的时候,比如同样进行100常篮球赛来比较李和张谁实力更强,张找顶级高手打20场赢1场,找一般选手打80场赢40场,那么他的总胜率是41%。而李则完全不同。
李找顶级高手打80场赢了8场,但是找一般选手打20场赢20场,那么他的总的胜率只有28%,初看起来李的胜率没有张高,但是里与高手过招的胜率达到10%,而张只有5%,明显是李实力更强,原因是与顶级高手过招的权重比与普通选手过招的权重要高。