|
統(tǒng)計(jì)學(xué)中有一個(gè)概念叫做Power,國(guó)外的統(tǒng)計(jì)學(xué)教材多有詳細(xì)的討論。在《R語(yǔ)言實(shí)戰(zhàn)》這本書(shū)中Power被翻譯為功效,與之相關(guān)的概念還有統(tǒng)計(jì)功效(Statistical power)、功效分析(Power analysis)等。 要說(shuō)Power,還得從假設(shè)檢驗(yàn)說(shuō)起。假設(shè)檢驗(yàn)是根據(jù)研究的問(wèn)題預(yù)先設(shè)定一個(gè)零假設(shè)(null hypothesis,H0)和一個(gè)備擇假設(shè)(alternative hypothesis,H1),然后從總體中抽樣,通過(guò)計(jì)算樣本統(tǒng)計(jì)量來(lái)估計(jì)總體的特征。假設(shè)零假設(shè)為真,如果計(jì)算得到的觀測(cè)樣本統(tǒng)計(jì)量的概率小于某個(gè)特定值(這個(gè)特定概率要事先設(shè)定,常見(jiàn)的比如0.05),則認(rèn)為這是小概率事件,統(tǒng)計(jì)學(xué)中認(rèn)為小概率事件不可能發(fā)生,從而拒絕零假設(shè),接受備擇假設(shè)。否則就無(wú)法拒絕原假設(shè)(但是不能說(shuō)接受零假設(shè),無(wú)法拒絕和接受之間是有距離的)。 假設(shè)檢驗(yàn)中可能會(huì)出現(xiàn)第一型及第二型錯(cuò)誤(Type I and type II errors)。第一型錯(cuò)誤有的統(tǒng)計(jì)學(xué)書(shū)中稱(chēng)為假陽(yáng)性錯(cuò)誤,意思是零假設(shè)實(shí)際上是正確的,但是卻被錯(cuò)誤地拒絕了;第二型錯(cuò)誤也稱(chēng)為假陰性錯(cuò)誤,意思是零假設(shè)是錯(cuò)誤的,但是卻錯(cuò)誤地沒(méi)有被拒絕。這兩種錯(cuò)誤在實(shí)際研究工作中是應(yīng)該避免的,用表格表示如下:
而Power簡(jiǎn)單來(lái)說(shuō)就是在零假設(shè)錯(cuò)誤的情況下成功拒絕零假設(shè)接受備擇假設(shè)的概率(1-β),用公式來(lái)表示就是:
Power是檢驗(yàn)研究工作有效性的一個(gè)很有用的指標(biāo),Power越大,說(shuō)明犯第二型錯(cuò)誤的概率越小。在實(shí)際研究工作中,Power值越大說(shuō)明拒絕零假設(shè)的底氣越足,研究結(jié)果也越可靠。影響Power值大小的因素有:樣本容量——樣本容量越大,犯錯(cuò)誤的概率就越小,Power就越大;Effect size(不知道咋翻譯,影響量級(jí)?)的大小——Effect size越大則Power越大;樣本的變異程度——方差越小Power越大;統(tǒng)計(jì)顯著性的閾值標(biāo)準(zhǔn),假設(shè)檢驗(yàn)標(biāo)準(zhǔn)設(shè)為0.01相比0.05顯然更難于拒絕零假設(shè),Power值也越小。 R中可以用pwr包來(lái)實(shí)現(xiàn)對(duì)Power的分析。 |
|
|
來(lái)自: 昵稱(chēng)65357543 > 《待分類(lèi)》