【秋招】统计学相关面试笔记

置信区间。假设检验。方差分析

Posted by Zaki on July 12, 2022

置信区间

置信区间是指由样本统计量所构造的总体参数的估计区间。

而这个c值,是阿尔法分位点,一般我们可以查正态分布表知道。置信区间为90%的c值为1.64,95%是1.96,99%是2.58.

比如这个例题,糖果公司抽取了一个大小为50的样本,发现样本中红色糖球的比例为0.25,请为总体中具有这一比例的红色糖球,构建一个置信水平为99%的置信区间。

我们的公式中,用二项,这个c取2.58, n是50,p是0.25,q是0.75.

假设检验

对总体分布未知,分为两种情况,一种是分布未知,一种是参数未知。未知形成某种推断,然后检验。

假设检验,其实就是检验“假设”成立与否的一个过程。

显著性检验

显著性检验是“统计假设检验”(Statistical hypothesis testing)的一种,显著性检验是用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法

所谓统计假设检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理。而把只限定第一类错误概率的统计假设检验就称之为显著性检验。

显著性水平α,是在原假设为真时拒绝原假设的概率。例如,显著性水平0.05表示当没有实际差异时得出存在差异,会有5%的风险。

P值是一概率值,指的是当原假设H0成立时,出现目前情况的概率

第一类错误和第二类错误:

由于检验法则是根据样本作出的,总有可能作出错误的决策。

在假设H0实际上为真时,我们可能犯拒绝H0的错误,称这类“弃真”的错误为第Ⅰ类错误.

又当H0实际上不真时,我们也有可能接受H0, 称这类“取伪”的错误为第Ⅱ类错误.