关于上海公安局泄露人口数据的几个问题

https://telegra.ph/file/e8246c11855bffb1245b1.jpg
这是关于隔壁帖子想起来的。感谢那位葱油提出这样一个有意思的观察点。我把他的图圈点了一下。
从10+亿的数据中提取25万数据,吻合程度还是不错的。这出现的主要偏差是1900年附近人口和2000年之后人口。
1900年人口的偏差其他葱油已经解释过了,而且很合理。
思考后我的几个问题,提出来供大家讨论
图中红圈1的部分,明显是1958-1960年大饥荒的结果。有意思的是,1962年出生人口数据马上就跳回到原有趋势线上,看样子大饥荒中育龄人口损失较少。大饥荒造成人口损失,应当包括非正常死亡+未出生。看图,光是少出生的人口就在2000万+的水平。
图中红圈2的部分更有意思。从1970年代开始,出生人口竟然下降了近10年!要知道中国在1970年代末期开始推广计划生育。为什么在新生人口持续下降了多年后开始强力推广计划生育呢?是当政者预测到了1980-1990年的新生人口反弹么?如果当时的中国人平均20-25岁进入生育期的话,那么1980年代的新生人口增长就是大饥荒后婴儿潮一代人进入生育期造成的。
图中红圈3的数据偏差最引人注目。说实话我觉得上海公安局的数据可能有偏差。我不知道这25万人是不是有了纠纷/犯罪记录后才被记录的。如果是那样的话,15岁以下卷入纠纷的概率很低,数据出奇的低也就合理了。图中看2020年新生人口也就200-300万,这些孩子有一半以上是疫情发生前怀上的,应当未受封控影响,太低了。
但是,如果我们假设两组数据没有上述的统计口径的偏差,问题就大了。两组数据大规模偏离发生在2003年。我粗略计算了一下,2003-2021年两组数据的差距达到了3.2亿以上,也就是少了3.2亿18岁以下的青少年,是亡国灭种的节奏。七普数据里,14岁以下人口一共才2.5亿。所以我还是倾向于上海公安局数据有偏差。
将来谁能搞到10亿人的总数据做统计,那样就精准多了。
P.S.据别的葱油指出,3.2亿可能高估了。这是看图大概算的,正确值可能2-3亿之间

© 版权声明
THE END
喜欢就支持一下吧
点赞9
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称图片

    暂无评论内容