电竞比分网-中国电竞赛事及体育赛事平台

分享

[數(shù)據(jù)挖掘]聚類算法一覽[知識分享-知合網(wǎng)]

 夢想的邊緣 2006-12-29
[數(shù)據(jù)挖掘]聚類算法一覽

  聚類分析是數(shù)據(jù)挖掘中的一個很活躍的研究領(lǐng)域,并提出了許多聚類算法。這些算法可以被分為劃分方法、層次方法、基于密度方法、基于網(wǎng)格方法和基于模型方法。

1 、劃分方法(PAM:PArtitioning method)  首先創(chuàng)建k個劃分,k為要創(chuàng)建的劃分個數(shù);然后利用一個循環(huán)定位技術(shù)通過將對象從一個劃分移到另一個劃分來幫助改善劃分質(zhì)量。典型的劃分方法包括:
k-means,k-medoids,CLARA(Clustering LARge Application),
CLARANS(Clustering Large Application based upon RANdomized Search).
FCM

2、 層次方法(hierarchical method)  創(chuàng)建一個層次以分解給定的數(shù)據(jù)集。該方法可以分為自上而下(分解)和自下而上(合并)兩種操作方式。為彌補分解與合并的不足,層次合并經(jīng)常要與其它聚類方法相結(jié)合,如循環(huán)定位。典型的這類方法包括:
第一個是;BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies) 方法,它首先利用樹的結(jié)構(gòu)對對象集進行劃分;然后再利用其它聚類方法對這些聚類進行優(yōu)化。
第二個是CURE(Clustering Using REprisentatives) 方法,它利用固定數(shù)目代表對象來表示相應(yīng)聚類;然后對各聚類按照指定量(向聚類中心)進行收縮。
第三個是ROCK方法,它利用聚類間的連接進行聚類合并。
最后一個CHEMALOEN,它則是在層次聚類時構(gòu)造動態(tài)模型。

3、 基于密度方法,根據(jù)密度完成對象的聚類。它根據(jù)對象周圍的密度(如 DBSCAN)不斷增長聚類。典型的基于密度方法包括:
    DBSCAN(Densit-based Spatial Clustering of Application with Noise):該算法通過不斷生長足夠高密度區(qū)域來進行聚類;它能從含有噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。此方法將一個聚類定義為一組“密度連接” 的點集。
    OPTICS(Ordering Points To Identify the Clustering Structure):并不明確產(chǎn)生一個聚類,而是為自動交互的聚類分析計算出一個增強聚類順序。。

4 、基于網(wǎng)格方法,首先將對象空間劃分為有限個單元以構(gòu)成網(wǎng)格結(jié)構(gòu);然后利用網(wǎng)格結(jié)構(gòu)完成聚類。
    STING(STatistical INformation Grid) 就是一個利用網(wǎng)格單元保存的統(tǒng)計信息進行基于網(wǎng)格聚類的方法。
    CLIQUE(Clustering In QUEst)和Wave-Cluster 則是一個將基于網(wǎng)格與基于密度相結(jié)合的方法。

5、 基于模型方法,它假設(shè)每個聚類的模型并發(fā)現(xiàn)適合相應(yīng)模型的數(shù)據(jù)。典型的基于模型方法包括:

    統(tǒng)計方法COBWEB:是一個常用的且簡單的增量式概念聚類方法。它的輸入對象是采用符號量(屬性-值)對來加以描述的。采用分類樹的形式來創(chuàng)建一個層次聚類。
    CLASSIT 是COBWEB的另一個版本.。它可以對連續(xù)取值屬性進行增量式聚類。它為每個結(jié)點中的每個屬性保存相應(yīng)的連續(xù)正態(tài)分布(均值與方差);并利用一個改進的 分類能力描述方法,即不象COBWEB那樣計算離散屬性(取值)和而是對連續(xù)屬性求積分。但是CLASSIT方法也存在與COBWEB類似的問題。因此它 們都不適合對大數(shù)據(jù)庫進行聚類處理.

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多