电竞比分网-中国电竞赛事及体育赛事平台

分享

畫(huà)說(shuō)統(tǒng)計(jì) | 雙因素方差、單因素方差,都是方差觸類旁通矣

 昵稱209735 2021-12-14

方差分解是個(gè)神奇還有用的分析思想。在前面的短文中我們從我們“熱愛(ài)”的t-檢驗(yàn),這種只包括兩個(gè)比較組的特殊單因素方差分析開(kāi)始,了解了無(wú)論是幾個(gè)比較組:

圖片

方差分析的思想都是先求出總平均值

圖片

然后求每個(gè)觀察值相對(duì)于總平均的變異再做平方

圖片

于是加起來(lái)就是總方差(離差平方和,SS總):

圖片

接下來(lái):用同樣的方法獲得各組平均值

圖片

以及各觀測(cè)值相對(duì)于自己組平均值的變異平方,

圖片

在求組內(nèi)變異平方和,是為SS組內(nèi),

圖片

以及各組平均值相對(duì)于總平均值的變異

圖片

即為SS組間

 圖片

而且總有:SS總=SS組內(nèi)+SS組間

圖片

或者說(shuō),從變異分解的角度看,方差分析主要探討的是變異的來(lái)源問(wèn)題。很顯然,完成以上的差別性檢驗(yàn)時(shí),我們期待驗(yàn)證的都是當(dāng)研究因素處在不同水平的時(shí)候(也就是不同的分組,例如不同性別分組,不同藥物劑量治療組之間)我們關(guān)心的測(cè)量指標(biāo)(比如血壓,身高,血壓下降幅度)是否存在不同

圖片
對(duì)于總變異(SS總)可以把他分解為:由分組因素水平間的不同所解釋的變異SS組間,分組因素和未被分組因素解釋的變異SS組內(nèi),誤差)組成的。

圖片

在此基礎(chǔ)上,再通過(guò)組間組內(nèi)變異的“比例”分析構(gòu)建統(tǒng)計(jì)量獲得P值。

那么總變異中,被分組因素解釋的比例越高,分組的貢獻(xiàn)越大,組間的不同也就更加的“顯而易見(jiàn)”

圖片于是問(wèn)題來(lái)了,如果在研究中,我們關(guān)注的影響結(jié)局的分組因素不止一個(gè)的時(shí)候,該怎么辦?還能分析嗎?

必須能,在應(yīng)用領(lǐng)域中,理論的發(fā)展永遠(yuǎn)是以科學(xué)性為基礎(chǔ),以應(yīng)用需要為導(dǎo)向的

下面以兩個(gè)因素為例,畫(huà)來(lái)看,這就是今天的主題雙因素方差分析

現(xiàn)在設(shè)想包括兩個(gè)研究因素的情況。比如說(shuō)要研究?jī)煞N不同的營(yíng)養(yǎng)液(A和B)對(duì)于神經(jīng)細(xì)胞生長(zhǎng)的作用。于是我們按照兩種營(yíng)養(yǎng)液的使用情況一共分成了4個(gè)研究組

     第一組(A-B-):不加用任何營(yíng)養(yǎng)液

     第二組(A+B-):加用A營(yíng)養(yǎng)液

     第三組(A-B+):加用B營(yíng)養(yǎng)液

     第四組(A+B+):同時(shí)加用AB兩種營(yíng)養(yǎng)液

根據(jù)以上研究設(shè)計(jì)完成研究獲得的治療有效性結(jié)果如圖所示。

圖片

第一件事情當(dāng)然是獲得總平均值(直方圖是示意圖哈),以便了解總變異

圖片

還有各組的平均值(直方圖也是示意圖哈)

圖片

可是這樣一來(lái),這不就是包含4個(gè)比較組的單因素方差分析嗎,

圖片

跟三個(gè)比較組的情況沒(méi)有本質(zhì)區(qū)別呀。

圖片

但這時(shí)最重要的是:數(shù)據(jù)分析是服務(wù)于研究目的,而不是由數(shù)據(jù)的“樣貌”決定分析方法,如果我們想了解的是兩種藥物的作用,而不是四種治療組合之間的不同,那么直接當(dāng)作四個(gè)平行的比較組完成分析其實(shí)就不合適了,因?yàn)橄鄳?yīng)的單因素方差分析及接下來(lái)的兩兩組間比較只回答了各組間的不同而沒(méi)有直接回答兩個(gè)研究因素:營(yíng)養(yǎng)液A和營(yíng)養(yǎng)液B是否有促進(jìn)生長(zhǎng)的的作用。

從四組的總體情況看,A、B兩種營(yíng)養(yǎng)液實(shí)際上都包括了使用和未使用兩種情況(我們也稱之為A因素的兩個(gè)水平),也正是通過(guò)這兩種情況的比較我們就可以看出這兩種營(yíng)養(yǎng)液的作用了?;蛘哒f(shuō),當(dāng)我們聚焦在A的時(shí)候,其實(shí)我們看到的是針對(duì)這個(gè)因素的兩個(gè)水平之間的比較。只不過(guò)兩組中都有一半使用了B營(yíng)養(yǎng)液另一半沒(méi)有。對(duì)于B的分析也是一樣的狀況。

那么該怎么分析呢

我們需要先在同樣的“投影”關(guān)系下,給他們稍微變變隊(duì)形。

圖片

這么一變形,我們終于把四個(gè)小組在兩種研究因素間的關(guān)系給表現(xiàn)出來(lái)了:

沿著右前45度的方向,我們看到了針對(duì)A因素的兩個(gè)水平,

圖片


雖然兩水平中各有一半研究對(duì)象使用了營(yíng)養(yǎng)液B,但在呈現(xiàn)因素A的作用上,只要A所處的水平相同,他們的屬性就是相同的。所以,在針對(duì)因素A的分析中,不管有沒(méi)有加用營(yíng)養(yǎng)液B,只要按照A的使用情況,把他們合并作為兩個(gè)比較組分析,

圖片

就可以完成針對(duì)A因素的方差的分解,了解在總變異中,有多少變異是由分組因素A帶來(lái)的(SS組間),其余的則是A因素不能解釋變異(SS組內(nèi))

圖片

采用同樣的方法,從左前45度望去

圖片

我們就看到了B因素的兩個(gè)水平,

圖片

并且也可以完成針對(duì)因素B的方差分解,了解總變異中有B因素所處水平不同所解釋的變異。

圖片

這樣總變異就被我們分解成了由因素A帶來(lái)的組間變異(SS 因素A)、 因素B帶來(lái)的組間變異(SS 因素B),

圖片

以及未能由兩個(gè)研究因素解釋的剩余部分(SS誤差)

圖片

然后同樣基于分組因素解釋的變異與剩余誤差之間的比例關(guān)系構(gòu)建統(tǒng)計(jì)量并且獲得P值,檢驗(yàn)就完成了。

圖片

真的是跟單因素方差“如出一轍”吧。

不過(guò)這并不是全部:

還有重要思考需要分享:

是不是所有包括兩個(gè)研究因素的情形都一定做雙因素分析呢,還真是不一定。

圖片

總要記在心里的話:

統(tǒng)計(jì)分析是為研究目的服務(wù)的,只有能夠回答研究問(wèn)題的方法才是合理的選擇和應(yīng)用。

從雙因素方差分析的出發(fā)點(diǎn)看,它能夠回答的問(wèn)題是各因素不同水平間的比較,而不回答四種治療“組合”之間的不同。所以當(dāng)我們的研究目的是考察某兩個(gè)因素對(duì)結(jié)局的作用的時(shí)候,雙因素方差是合理的選擇。

從前圖所說(shuō)明的分析策略看,在針對(duì)A因素展開(kāi)分析時(shí),雙因素方差分析會(huì)按照因素A所處的不同水平把原始分組做合并(B因素的狀態(tài)并不在考慮之列),再通過(guò)組間比較了解研究因素在不同水平間的差異,從而說(shuō)明該因素對(duì)研究結(jié)局的作用,我們稱之為主效應(yīng)。

圖片

不過(guò)在很多研究場(chǎng)景下。兩個(gè)研究因素的作用我們已經(jīng)有了前期的了解,而把他們放在一起是為了找到最佳的強(qiáng)度組合,這個(gè)時(shí)候顯然雙因素方差的分析策略就并不適合了,這個(gè)時(shí)候似乎把不同的處理組合視作平行的比較組完成單因素方差分析才更合理。

圖片

總之,并不是看到兩個(gè)包括兩個(gè)研究因素的效應(yīng)強(qiáng)度分析(當(dāng)然要符合參數(shù)檢驗(yàn)條件啦),就只想到雙因素方差分析這一條思路。是選擇將各處理組作為平行比較組的單因素方差分析,還是主要針對(duì)處理因素的雙因素方差分析永遠(yuǎn)是基于研究目標(biāo)的重要選擇

故事還沒(méi)有結(jié)束,大概都聽(tīng)說(shuō)過(guò)那種叫做“析因設(shè)計(jì)”這個(gè)詞,其中經(jīng)常提到一個(gè)叫做“交互效應(yīng)”的概念。

其實(shí)交互效應(yīng)我們以前畫(huà)過(guò)的。相當(dāng)于兩種因素的作用是彼此不獨(dú)立的,也就是合在一起用的時(shí)候他們的共同作用并非兩種因素作用的疊加。

圖片

其實(shí)變異分解的角度,它不過(guò)是多分解了一個(gè)交互效應(yīng)的維度

圖片

這里要提醒的是當(dāng)存在交互效應(yīng)時(shí),針對(duì)因素的主效應(yīng)就沒(méi)有意義了。如交互效應(yīng)疑問(wèn)已經(jīng)提到的,交互效應(yīng)可以簡(jiǎn)單理解為當(dāng)兩種因素同時(shí)出現(xiàn)時(shí)會(huì)產(chǎn)生1+1≠2的效果。也就是在因素B處于不同水平時(shí),因素A所體現(xiàn)的作用強(qiáng)度是不一樣的。而在針對(duì)主效應(yīng)分析中,我們B因素處在什么水平,我們都只按照因素A的分組情況做分析。這只有在A的作用不受B因素水平影響的時(shí)候也就是他們相互獨(dú)立的時(shí)候才是合理的。一旦出現(xiàn)交互效應(yīng),那么要想說(shuō)明白A的作用,就需要首先按照B的水平做分層,才能說(shuō)明白了,這樣的效應(yīng)分析也有專門的名字叫做簡(jiǎn)單效應(yīng)。

圖片

再多的因素會(huì)是怎樣,道理都是一樣的還請(qǐng)各位自行舉一反三,三維之內(nèi),本公眾號(hào)實(shí)在是無(wú)能為力,確實(shí)畫(huà)不出來(lái)了。

感謝梅花樁拳學(xué)者,好兄弟盧雙同學(xué)的認(rèn)真審核

圖片

圖片

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多