spearman相關(guān)系數(shù)
在統(tǒng)計學(xué)中,斯皮爾曼等級相關(guān)系數(shù)以Charles Spearman命名,并經(jīng)常用希臘字母ρ(rho)表示其值。斯皮爾曼等級相關(guān)系數(shù)用來估計兩個變量X、Y之間的相關(guān)性,其中變量間的相關(guān)性可以使用單調(diào)函數(shù)來描述。如果兩個變量取值的兩個集合中均不存在相同的兩個元素,那么,當(dāng)其中一個變量可以表示為另一個變量的很好的單調(diào)函數(shù)時(即兩個變量的變化趨勢相同),兩個變量之間的ρ可以達到+1或-1。
秩相關(guān)系數(shù),秩相關(guān)系數(shù)還有其他類型,比如kendal秩相關(guān)系數(shù)
-使用Pearson線性相關(guān)系數(shù)有2個局限:
* 1.必須假設(shè)數(shù)據(jù)是成對地從正態(tài)分布中取得的。*
* 2. 數(shù)據(jù)至少在邏輯范圍內(nèi)是等距的。*
對原始數(shù)據(jù)xi,yi按從大到小排序,記x’i,y’i為原始xi,yi在排序后列表中的位置,x’i,y’i稱為xi,yi的秩次,秩次差di=x’i-y’i。Spearman秩相關(guān)系數(shù)為:
ρs=1?6∑d2in(n2?1)
| 位置 |
原始X |
排序后 |
秩次 |
原始Y |
排序后 |
秩次 |
秩次差 |
| 1 |
12 |
546 |
5 |
1 |
78 |
6 |
1 |
| 2 |
546 |
45 |
1 |
78 |
46 |
1 |
0 |
| 3 |
13 |
32 |
4 |
2 |
45 |
5 |
1 |
| 4 |
45 |
13 |
2 |
46 |
6 |
2 |
0 |
| 5 |
32 |
12 |
3 |
6 |
2 |
4 |
1 |
| 6 |
2 |
2 |
6 |
45 |
1 |
3 |
-3 |
對于上表數(shù)據(jù),算出Spearman秩相關(guān)系數(shù)為:
1?6(1+1+1+9)6?(62?1)=0.6571
查閱秩相關(guān)系數(shù)檢驗的臨界值表
| n |
|
顯著水平 |
|
0.05 |
0.01 |
| 5 |
0.9 |
1 |
| 6 |
0.829 |
0.943 |
| 7 |
0.714 |
0.893 |
置信度=1-顯著水平。上表顯示在n=6的時候,當(dāng)spearman秩相關(guān)系數(shù)>=0.829時我們有95%的置信度認為兩個隨機變量相關(guān),當(dāng)spearman秩相關(guān)系數(shù)>=0.943時我們有99%的置信度認為兩個隨機變量相關(guān)。由于0.6571<0.829,即置信度達不到95%,所以我們不能認為X和Y相關(guān)。
如果原始數(shù)據(jù)中有重復(fù)值,則在求秩次時要以它們的平均值為準(zhǔn)
P值(p-values)
P值是配對t檢驗(paired t-test)計算過程中得到的結(jié)果,用來評估前面所述相關(guān)程度計算結(jié)果的“顯著程度”。在常用統(tǒng)計軟件SPSS中,P值(p-value,有時顯示為Sig-value)的計算是建立在如下兩個假設(shè)基礎(chǔ)上的:
無效假設(shè)(null hypothesis) H0:r=0,兩參量間不存在“線性”關(guān)聯(lián)
備擇假設(shè)(alternative hypothesis) H1:r≠0,兩參量間存在“線性”關(guān)聯(lián)
如果計算出的P值很小,比如0.001,則可說“有非常顯著的證據(jù)拒絕H0假設(shè),相信H1假設(shè),既兩參量間存在顯著的線性關(guān)聯(lián)”
P值得數(shù)值大小沒有統(tǒng)計意義,只是將其與某一個閾值進行對比,以得到二選一的結(jié)論。關(guān)于P值得判斷閾值,可參照下面給出的建議:
典型的閾值取為0.05(5%)。因此判斷規(guī)則如下:
? P≤0.05,拒絕無效假設(shè),接受備擇假設(shè),即“存在顯著的線性關(guān)聯(lián)”;
? P>0.05,拒絕無效假設(shè)失敗。
|