战巡:论2017、2018年高考统计类题目的坑爹性

发布于 2018-06-13 大家论道 1052 字 预计阅读时间: 5 分钟


AI 摘要

高考统计题又出幺蛾子!直方图滥用、数据瞎分、符号乱用,连续五年怒怼,这些题目到底坑了多少考生?专业统计视角带你一探究竟!
内容纲要

全文

论2017、2018年高考统计类题目的坑爹性

——战巡

  这个东西已经连续写到第五年了,真是永恒的高考,永恒的统计坑!只是这两年很多省都不再自己出题,用的同一份卷子,搞得题目少了,所以只能两年的题目写一篇,但坑还是那么坑!

  废话不说了,直接上题

1、2017北京卷理科17

2、2017全国卷I文科19

3、2017全国卷II理科18/文科19

又见直方图!说了多少次了,直方图只是拿来看个大概趋势的,不是给你用来直接做统计分析的,统计分析用原始数据!

但这题最大的毛病不是直方图,而是下面的列联表,为毛会划分出“箱产量<50 kg”和“箱产量>=50 kg”这两类?你们不是有原始数据么?要不然怎么做得出直方图?原始数据一个好端端的连续变量,尼玛怎么就硬是拆成了只有两项的离散变量呢?比较两种方法直接两组做个t检验不就出来了?有你们这样折腾的么?!你们不知道这样会平白无故丢失很多信息,降低结果的可靠性?!

再说了,你这里的$K$是个什么玩意?你给我说清楚!这个分明是皮尔逊卡方检验,国际通用符号$\chi^2$,特喵哪有用$K$的?你们出题的是手残还是脑残?一个希腊字母写不出来?!

4、2018全国卷I理科20

这特喵什么鸟题?!

第一问你说有没有问题?没有问题,但特喵你能不能换个专业点的说法?20件有2件不合格的概率,这是什么?这就是似然函数(Likelihood function),而使它达到最大值的$p_0$是什么?就是$p$的最大似然估计(Maximum Likelihood Estimation(MLE))!对于高中生,没有学过MLE,按理说就特喵不应该考,对于大学生,直接说求$p$的MLE,他们就知道要干什么了。

第二问,特喵什么玩意!(i)也还罢了,(ii)你又想只比较个均值就下结论是不?

你这里的$p$是从20个样本里估计出来的,不是真实值,真实值你特么不知道,所以你在估计 $X=40+25·180\hat{p}$的时候,就必然有随机性,这里你第一问已经搞清楚了,要求的是这个$X$的均值,但特喵第二问你怎么搞?比较某随机变量的均值和一个常数的大小,你必须去做假设检验,你要敢直接拿 $E(X)=490$去和$400$比较大小,看劳资不打断你狗腿!

这里要怎么做?首先,我们可以倒过去算,如果 $E(X)=400$,那相对应的 $p=0.08$这个不难算,于是现在已知 $\hat{p}=0.1$,要比较$p$和$0.08$的大小。
好,这个怎么比?当然要假设检验,不妨用常用的 $\alpha=0.05$,这里用Wald法,$\hat{p}$的方差为$\frac{\hat{p}(1-\hat{p})}{n}$,于是有
$z=\frac{\hat{p}-0.08}{\sqrt{\frac{\hat{p}(1-\hat{p})}{20}}}=\frac{0.1-0.08}{\sqrt{\frac{0.1(1-0.1)}{20}}}=0.298<1.96=z_{0.975}$

很显然,特喵的不显著!p和0.08没有显著差异,那尼玛怎么下结论?!出题的混球你特么来告诉我!

5、2018全国卷I文科19

6、2018全国卷II理科18/文科18

7、2018年全国卷III理科18/文科18

8、2018年天津卷理科16/文科18

原帖