|
小編按 經(jīng)過了這么多集的學習,相信大家已經(jīng)對 t 檢驗了如指掌了吧!今天就由田菊師姐教我們?nèi)绾蚊枋?t 檢驗結(jié)果~ 講了這么多集關于 t 檢驗的知識,相信你們對統(tǒng)計檢驗有了更深入的了解,再也不會被輕易地被一些不靠譜的結(jié)果糊弄住了。 另外一方面,學習統(tǒng)計檢驗的原理也是為了能在我們自己寫論文的時候準確地描述實驗結(jié)果。如果不能把辛辛苦苦搜集來的實驗數(shù)據(jù)清晰地表達出來,導致自己的結(jié)論不能很快地被讀者理解,真對不起自己花那么多的時間做實驗。 描述 t 檢驗的結(jié)果可以通過文字列出關鍵數(shù)據(jù),也可以通過做圖來表示;前者更準確,后者更直觀,通常會兩者結(jié)合。 我們從下面的例子開始我們的統(tǒng)計「八股文」之路。 用單樣本 t 檢驗對比了格格巫包子的重量與標準包子重量(50g)的區(qū)別,發(fā)現(xiàn)格格巫包子的重量(平均值=45g,標準差=3g,95% 置信區(qū)間 [ 43.8g,46.2g ] )與標準值 50g 有顯著區(qū)別( t (25)=4.2, p < 0.001=""> 從例子我們可以看到,總結(jié) t 檢驗的結(jié)果首先要說明到底做了什么類型的檢驗(單樣本 t 檢驗,成對樣本的 t 檢驗,還是獨立樣本的 t 檢驗;如果搞不清楚可以參考《就是要實用!t 檢驗的七十二變》)。 光說明檢驗類型還不夠,還要說清楚數(shù)據(jù)到底是針對什么的測量,如果是對比兩組數(shù)據(jù),最好說清楚每一組具體的實驗條件。 說明檢驗的背景之后,就可以總結(jié)結(jié)果了。 首先可以通過數(shù)據(jù)的平均值和標準差來簡單描述一下數(shù)據(jù),最好還能像例子里面一樣加上 95% 置信區(qū)間,這樣可以方便讀者判斷效應大小,效應的概念可以參考《只講 p 值,不講效應大小,都是耍流氓!》。通過平均值和標準差以及對比的標準值,對結(jié)論感興趣的讀者可以直接估算出衡量效應大小的 Cohen 氏 d 值。當然,我們也可以直接給出該結(jié)果。 下一步根據(jù) p 值的大小來判斷是否有顯著性區(qū)別,通常 p 值小于 0.05,拒絕原假設,認為數(shù)據(jù)與標準值有顯著區(qū)別或者實驗組數(shù)據(jù)與對照組數(shù)據(jù)有著顯著區(qū)別。 t 檢驗的結(jié)果除了要給出 p 值,通常也會給出 t 統(tǒng)計量以及自由度(在單樣本情況下是等于樣本量減 1,在獨立樣本且兩個樣本方差相等的情況下等于總樣本量減 2)。根據(jù)我們之前在《想玩轉(zhuǎn)t檢驗?你得從這一篇看起》講過的,有了自由度,t 統(tǒng)計量的分布就能確定,結(jié)合樣本給出的 t 統(tǒng)計量大小其實就可以計算出精確的 p 值。 因為 p 值的具體數(shù)值對結(jié)論并不是很重要,所以在論文里面一般只給出 p 值的范圍即可。通常會把 p 值在分為四個區(qū)間:p<0.001,>0.001,><0.01,>0.01,><0.05,p>0.05。注意后一個區(qū)間并不包含前一個,例如 p=0.00005 的情況會寫作 p<0.001 而不會寫作="">0.001><> 有一個例外是如果 p 值接近顯著性的臨界值,比如 p=0.045 的情況,最好還是寫出 p 的具體數(shù)值而不是 p<> 不過話說回來,如果看到很接近 0.05 的 p 值,讀者難免會懷疑結(jié)果的真實性。所以遇到這種模棱兩可的 p 值,最好還是再重復兩次試驗驗證一下,得到的結(jié)果會更可信。 對于我們需要在統(tǒng)計結(jié)果報告中給出的這些數(shù)字,一般的統(tǒng)計軟件都會自動輸出,只需將它們按照前面例子里的格式寫出。不同的雜志對統(tǒng)計結(jié)果的格式會有不同的要求,投稿前要記得檢查一下雜志的具體要求,或者翻一下雜志近期發(fā)表的文章。 我們可以看到,在論文里面描述結(jié)果其實非常簡單,甚至不需要對 t 檢驗有什么深入的認識,那為什么我們要寫前面那么多期的文章來講解原理呢? 學會原理,我們才能選用最適當?shù)慕y(tǒng)計檢驗,并理解這些統(tǒng)計結(jié)果的準確含義,同時更好的解讀自己的結(jié)果和他人的結(jié)果,做起科研來也會更有信心。 除了用文字描述數(shù)據(jù),做圖往往也很重要?,F(xiàn)在很多讀者(甚至審稿人 )在看文獻的時候并沒有時間仔細地閱讀文字,而是直接掃一眼圖表。所以用圖表清晰地表現(xiàn)結(jié)果就至關重要了。 好的圖要直白,清晰,并且盡可能地包含多的信息。 表達同樣的一組數(shù)據(jù),我們可以用散點圖標出所有的數(shù)據(jù)點,也可以用箱線圖表示中位數(shù)、四分位數(shù)以及極端值(箱線圖具體可以參考《數(shù)據(jù)到手了,第一件事先干啥?》),或者用簡單的柱狀圖(高度代表數(shù)據(jù)平均值,一般還用誤差線標記樣本的標準差),見下圖的例子。 不難看出,從信息量的角度,散點圖>箱線圖>柱狀圖。因為散點圖包含了數(shù)據(jù)的所有信息,箱線圖可以大概表現(xiàn)出數(shù)據(jù)的分布,包括偏態(tài)和異常值的信息,而柱狀圖的信息只有平均值和標準差,并沒有提供比文字更多的信息。 當然,也不是信息量越多的圖越好,當數(shù)據(jù)點比較多(幾十個或以上時),點會開始重合,變成難以辨認的一團黑點,這樣反而不能清晰地展示結(jié)果,這時用箱線圖會比較好。 雖然箱線圖比柱狀圖信息更多,但目前很多發(fā)表的論文都傾向于用柱狀圖。為了阻止這一歪風邪氣蔓延,現(xiàn)在不少學術雜志已經(jīng)開始規(guī)定用箱線圖或者散點圖代替簡單的柱狀圖。 說實話我還真沒想出來什么情況下柱狀圖會比箱線圖更合適。假如出于某些原因一定用柱狀圖,不要忘了標清楚柱狀圖的誤差線是標準差( standard deviation, 縮寫為 sd 或者 std ),還是測量標準誤差(standard error of the mean,縮寫 se 或者 sem )。后者是前者除以 √n,這里 n 是樣本量,所以測量標準誤差比較小。咱們讀文獻的時候也要看清楚了,不要誤把測量標準誤當作標準差。 如果是成對樣本 t 檢驗的情形,用散點圖還可以清晰地展現(xiàn)每一對數(shù)據(jù)是否都一致地增加或者減少。 假設我們想知道 30 周的小鼠是不是比 20 周的更重,于是測量了 7 只小鼠在這兩個時間點的體重,由于對每個樣本測量了兩個值進行比較,所以這里的數(shù)據(jù)是成對數(shù)據(jù)。 在下圖中,B-D 這三個是用散點圖展現(xiàn)了三種不同的假想情況下的數(shù)據(jù), 左欄數(shù)據(jù)點代表小鼠 20 周體重,右欄數(shù)據(jù)代表 30 周體重,一條線連接的數(shù)據(jù)點都是成對樣本,來自同一只小鼠。
A 為柱狀圖(誤差線為測量標準誤差),B-D 為散點圖(B:每一對都上升;C:有些上升,有些下降,D:某幾個值上升很多,其它沒有太大變化),注意 B-D 組數(shù)據(jù)都對應 A 的柱狀圖。 不難看到,在 B 中,所有小鼠的體重都有所增長;在 C 中,有些小鼠體重增長,而另一些小鼠卻「為伊消得人憔悴」了;而在 D 中,一些小鼠體重增長,另一些小鼠則體重基本保持不變。顯然,這三種情形非常不一樣,但如果我們用柱狀圖來描繪這群小鼠在兩個時間點的平均體重和標準誤差,我們將會得到完全一樣的柱狀圖(即 A 中所示)! 這說明了不同的成對數(shù)據(jù)可以有相似的柱狀圖,用散點圖不但可以反映數(shù)據(jù)點真實趨勢,而且可以突出成對對比,體現(xiàn)出到底有多少對數(shù)據(jù)支持結(jié)論。B 圖的數(shù)據(jù)顯然比 C 和 D 圖更強烈地支持小鼠 30 周的體重大于 20 周的體重這一結(jié)論。 最后,統(tǒng)計顯著性也常常會用星星(*)在圖上表示。通常 *** 表示 p<0.001,** 表示="">0.001,**><><0.01,* 表示="">0.01,*><><0.05,對于 p="">0.05 的情況,通常可以標注為 n.s 或者 p>0.05,如下圖所示。 圖片來源 http://www./neuron/abstract/S0896-6273(15)00722-9 ***表示 p<0.001,n.s>0.001,n.s>紅色為實驗組,黑色為對照組。 難怪周圍有些小伙伴們會視星星如生命。但是希望一直關注「說人話的統(tǒng)計學」的讀者們不要唯星星是從,畢竟一個結(jié)果是否有意義還要看效應大小。 回復「統(tǒng)計學」可查看「說人話的統(tǒng)計學」系列合輯, 或點擊下方標題可閱讀本系列全部文章 >> 干貨 做統(tǒng)計,多少數(shù)據(jù)才算夠?(上) 做統(tǒng)計,多少數(shù)據(jù)才算夠?(下) 樣本分布不正態(tài)?數(shù)據(jù)變換來救場! >>> 自檢 >>> 番外篇 精選每日一題 更多精選題可回顧歷史推送文末 題目來源:考研西醫(yī)綜合全真模擬試卷 本期主播:保健藥酒 作者:田菊 |
|
|