|
記得前一篇博文寫(xiě)過(guò)關(guān)于K-MEANS的內(nèi)容,K-MEANS顧名思義K-均值,通過(guò)計(jì)算一類(lèi)記錄的均值來(lái)代表該類(lèi),但是受異常值或極端值的影響比較大,這里介紹另外一種算法K-medodis。 看起來(lái)和K-means比較相似,但是K-medoids和K-means是有區(qū)別的,不一樣的地方在于中心點(diǎn)的選取,在K-means中,我們將中心點(diǎn)取為當(dāng)前cluster中所有數(shù)據(jù)點(diǎn)的平均值,在 K-medoids算法中,我們將從當(dāng)前cluster 中選取這樣一個(gè)點(diǎn)——它到其他所有(當(dāng)前cluster中的)點(diǎn)的距離之和最小——作為中心點(diǎn)。 K-MEANS算法的缺點(diǎn): 這兒選取一個(gè)對(duì)象叫做mediod來(lái)代替上面的中心的作用,這樣的一個(gè)medoid就標(biāo)識(shí)了這個(gè)類(lèi)。 K-MEDODIS的具體流程如下: |
|
|
來(lái)自: quasiceo > 《待分類(lèi)1》