假設(shè)檢驗1、假設(shè)檢驗的由來我們先看一個例子: 那么如何檢驗這位女士的說法呢?FISHER進(jìn)行了研究,從而提出了假設(shè)檢驗的思想。 比如: 正常情況下我們?nèi)ゲ孪鹊共柽€是先倒牛奶的話,概率應(yīng)該是1/2, 1.總共檢驗了兩杯,全部猜對的概率是:0.5??0.5=0.25,雖然概率很低,但是也算正常; 2.繼續(xù)猜,又猜了兩次,也全部猜對了幾率是 3.我們繼續(xù)猜,加大樣本,如果連續(xù)猜對10杯,那么我認(rèn)為這位女士確實有特殊的能力。 雖然我們上面說猜對10杯來確認(rèn)這位女士有特殊能力,這只是我們的臆測,我們假設(shè)一個x,當(dāng)這位女士能夠猜對x杯才認(rèn)為這位女士確實有特殊的能力,其實對于我們最難的是來確認(rèn)著x。 下面我們就來看一下怎么樣來確認(rèn)這個x。
2、什么是假設(shè)檢驗假設(shè)檢驗(Hypothesis Testing):是推斷統(tǒng)計的最后一步,是依據(jù)一定的假設(shè)條件由樣本推斷總體的一種方法。 你提出你的假設(shè):說你有特殊的能力,可以品出先倒茶還是牛奶; 我提出要檢驗?zāi)愕募僭O(shè):品十(x)杯,看實驗結(jié)果是不是和你說的假設(shè)相符
假設(shè)檢驗其實就是假設(shè)和檢驗兩步,先提出假設(shè),之后再來驗證假設(shè)是不是合理的。 3、P值為了完成假設(shè)檢驗,需要先定義一個概念:P值。 根據(jù)上面的描述,這里假設(shè)檢驗的思路就是:
猜奶茶的實驗應(yīng)該符合二項分布(這就不解釋了),也就是:
在我們認(rèn)為猜之前沒有泄密(也就是確實是憑自己的嗅覺去猜)的前提下,猜10次應(yīng)該符合以下分布:
下圖表示的就是,假如猜是公平的情況下的分布圖:
也就是說猜10次能猜對8次的概率是0.0439 為了方便大家計算,附上python代碼:
把八次猜對概率,與更極端的九次猜對、十次猜對的概率加起來: 為什么要把更極端的情況加起來? 根據(jù)猜奶茶這個例子,可能你會覺得,我知道八次猜對出現(xiàn)不正常就行了,干嘛要把九次、十次加起來? 比如我們要猜1000次用二項分布來計算很麻煩,根據(jù)中心極限定理,我們知道,可以用正態(tài)分布來近似:
但是,對于正態(tài)分布,我沒有辦法算單點的概率(連續(xù)分布單點概率為0),我只能取一個區(qū)間來算極限,所以就取530、以及更極端的點組成的區(qū)間:
(我上面只取了單側(cè)P值,說明下:取單側(cè)還是雙側(cè),取決于你的應(yīng)用,什么叫做更極端的點,也取決于你的應(yīng)用) 3.1、單側(cè)檢驗
3.2 雙側(cè)檢驗
4、顯著水平總共猜10次,那么是出現(xiàn)7次猜對,可以認(rèn)為有特殊能力,還是9次猜對之后我才能確認(rèn)有特殊能力,這是一個較為主觀的標(biāo)準(zhǔn)。 我們一般認(rèn)為 P-value<=0.05 就可以認(rèn)為假設(shè)是不正確的。 0.05這個標(biāo)準(zhǔn)就是顯著水平,當(dāng)然選擇多少作為顯著水平也是主觀的。
我們可以認(rèn)為剛開始的假設(shè)(這位女士不能準(zhǔn)確的猜出先倒茶還是牛奶)錯的很“顯著”,也就是是有特殊能力的。 5、假設(shè)檢驗步驟我們回顧下我們剛才所說的,總結(jié)下:
這里簡單說下檢驗統(tǒng)計量
6、實例我們這里舉2個例子: 首先我們先引入一個檢驗統(tǒng)計量分布的選擇規(guī)則
例1:
我們知道總體均值和總體方差,根據(jù)上圖的規(guī)則可以看出我們可以用Z統(tǒng)計量:
例2:
本例自由度v=n-1=35-1=34,查表得得t0.05/2,34=2.032。 因為t < t0.05/2,34,故P>0.05,按 α=0.05水準(zhǔn),不拒絕H0,差別無統(tǒng)計學(xué)意義,尚不能認(rèn)為該地難產(chǎn)兒與一般新生兒平均出生體重不同。
以上就是對假設(shè)檢驗思想的一個簡單介紹,其實對于理論的介紹理解起來比較晦澀,就像我們用1+1=2很簡單,要是理解1+1為什么等于2就難了。假設(shè)檢驗在運(yùn)用的時候就像最后的兩個例子,其實是很簡單的,但是對于理論的理解就需要比較長的時間。 |
|
|