1.Abstract

参加Datewhale的统计学课程,巩固下理论知识

2.Background

去年考的数学一,基础还可以,不算吃力

3.Task3(2days)

【任务内容】
学习内容1
47-53集 假设检验(一)
学习内容2
54-61集 假设检验(二)

4.Work

假设检验
基本原理
假设检验是数理统计中根据一定假设条件由样本推断总体的一种方法,依据的原理是小概率事件原理,即小概率事件在一次试验中是几乎不可能发生的。

基本概念与基本步骤
基本步骤
1.建立假设——原假设与备择假设
原假设记作H0 ,是指待检验的假设,一般为研究者想要收集证据反对的,没有充分理由否定的假设。
备择假设记作H1 ,是指与原假设相对的假设,一般为研究者想要收集证据支持的,没有充分理由肯定的假设。
一般来说是相互对立的,但有时可能存在既拒绝原假设又无法接受的备择假设的情况。
2.确定适当的检验统计量(t,p,z)并计算。
(1) 在样本容量<30,且总体方差σ \sigmaσ未知时,采用t-统计量进行假设检验。即指定抽样分布服从t分布,并查阅分布表进行对比。
(2)在样本容量>30,且总体方差已知(若样本容量<30也可以)时,采用z-统计量进行假设检验。即抽样分布服从正态分布,并查阅z-值表进行对比。
(3)样本容量>30,也可以通过计算p值,并与显著性水平α \alphaα进行对比进行检验。p值指小概率事件发生概率,显著性水平则指拒绝原假设的概率(α \alphaα通常很小,由人为决定)
3.给定显著性水平,确定拒绝域,并进行判断
检验统计量若落入抽样分布的拒绝域,则可以拒绝原假设,接受备择假设。
检验规则有两种:
(1)临界值规则。将检验统计量的值(t,z)与显著性水平的临界值进行对比,得出是否拒绝原假设。
(2)P—值规则。指将检验统计量对应的概率p与显著性水平进行对比,得出是否拒绝原假设。
4.一般也可以由结果得出置信区间。

两类错误
第一类错误
指原假设事实上为真,但却拒绝原假设的错误,也叫弃真错误,σ \sigmaσ错误。

第二类错误
指原假设事实上为假,但却接受原假设的错误,也叫取伪错误,β \betaβ错误。
人们总希望σ \sigmaσ,β \betaβ越小越好,但当样本容量一定时,一类错误几率减小,另一类错误几率便增大。若要使两类错误概率都减小,只能增加样本容量。