假设支持柯侯配在选民中的比例为p1,支持候柯配的比例为p2,当分别选取N为调查样本数时(两党公布的民调似乎都是使用同一组样本,这使得两次抽样变得不独立,以下为了简化分析先假设抽样独立),二者的差值的误差应该为
Z(CI)×sqrt(((1-p1)*p1+(1-p2)*p2)/N) 其中Z(CI)以CI为置信度的z-score, 由于两个组合的支持度无法事先得知,因此保守起见将p(1-p)取最大值 1/4,
使用以下程序计算置信度为0.95的取样结果差值的误差(参数n为样本数):
```python
import math
from statistics import NormalDist
def margin_of_error(n):
return math.sqrt(1/2/n)*NormalDist().inv_cdf(0.95/2+0.5)
```
根据两党提供的六份民调数据算出以下表格:
日期 调查机构 柯侯 侯柯 差值 样本数 差值误差(极大值)
11-13 汇流 48.3% 46.10% +2.20% 2046 ± 3.06%
11-14 联合报 41.00% 42.00% -1.00% 1149 ± 4.09%
11-17 镜电视 46.60% 46.50% +0.10% 1112 ± 4.16%
11-17 竞争力 46.01% 40.82% +5.19% 1112 ± 4.16%
11-17 民众党 44.00% 39.70% +4.30% 1082 ± 4.21%
11-17 国民党 38.80% 38.20% +0.60% 1484 ± 3.60%
综上,按照双方签署的协议两个组合的比分是柯2点对比侯4点,既不是民众党主张的3:3,也不是国民党主张的1:5,但是需要说明的是以上假设两个组合的支持率是通过不重叠的两组样本进行调查,如果是同一组调查样本那么由于概率分布有关联性,难以计算出真正的差值误差,也就是这种调查方法不能计入到对比中来。
我查了下公开的4组非政党调查机构公布的调查方法,无一例外全部是同一组样本进行调查,推测两党内参民调大概率也没有进行分组独立调查。由于存在关联性,这6组民调数字也根本不具有统计学意义上的参考价值(从评估柯侯与侯柯差异性的角度)。因此如果两党要继续进行蓝白合民调的话,必须要分出独立的两组样本分别调查柯侯与侯柯的支持率,然后按照上面的方式计算差值误差,才能在统计学上说服广大选民
暂无评论内容