电竞比分网-中国电竞赛事及体育赛事平台

分享

數(shù)據(jù)挖掘聚類(lèi)算法之K

 quasiceo 2016-01-18
(2014-07-02 14:26:11)

得前一篇博文寫(xiě)過(guò)關(guān)于K-MEANS的內(nèi)容,K-MEANS顧名思義K-均值,通過(guò)計(jì)算一類(lèi)記錄的均值來(lái)代表該類(lèi),但是受異常值或極端值的影響比較大,這里介紹另外一種算法K-medodis。

看起來(lái)和K-means比較相似,但是K-medoids和K-means是有區(qū)別的,不一樣的地方在于中心點(diǎn)的選取,在K-means中,我們將中心點(diǎn)取為當(dāng)前cluster中所有數(shù)據(jù)點(diǎn)的平均值,在 K-medoids算法中,我們將從當(dāng)前cluster 中選取這樣一個(gè)點(diǎn)——它到其他所有(當(dāng)前cluster中的)點(diǎn)的距離之和最小——作為中心點(diǎn)

[轉(zhuǎn)載]數(shù)據(jù)挖掘聚類(lèi)算法之K-MEDOIDS

[轉(zhuǎn)載]數(shù)據(jù)挖掘聚類(lèi)算法之K-MEDOIDS

K-MEANS算法的缺點(diǎn):
產(chǎn)生類(lèi)的大小相差不會(huì)很大,對(duì)于臟數(shù)據(jù)很敏感。
改進(jìn)的算法:K-medoids方法。

這兒選取一個(gè)對(duì)象叫做mediod來(lái)代替上面的中心的作用,這樣的一個(gè)medoid就標(biāo)識(shí)了這個(gè)類(lèi)。

K-MEDODIS的具體流程如下:
1)任意選取K個(gè)對(duì)象作為medoids(O1,O2,…Oi…Ok)?! ?br/>2)將余下的對(duì)象分到各個(gè)類(lèi)中去(根據(jù)與medoid最相近的原則);  
3)對(duì)于每個(gè)類(lèi)(Oi)中,順序選取一個(gè)Or,計(jì)算用Or代替Oi后的消耗—E(Or)。選擇E最小的那個(gè)Or來(lái)代替Oi。這樣K個(gè)medoids就改變了。
4)重復(fù)2、3步直到K個(gè)medoids固定下來(lái)?! ?br/>不容易受到那些由于誤差之類(lèi)的原因產(chǎn)生的臟數(shù)據(jù)的影響,但計(jì)算量顯然要比K-means要大,一般只適合小數(shù)據(jù)量。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多