|
一、案例背景: 某電信公司想針對(duì)用戶手機(jī)通話記錄,希望從用戶歷史通話數(shù)據(jù)中,運(yùn)用數(shù)據(jù)挖掘 (Data Mining)中的分類(Classification)技術(shù),分析出會(huì)影響電信用戶流失的相關(guān)因素,并建立能預(yù)測(cè)用戶是否流失的數(shù)據(jù)挖掘分類模型。
二、報(bào)告演示。 此案例遵循CRISP-DM數(shù)據(jù)挖掘流程實(shí)施。 數(shù)據(jù)準(zhǔn)備階段主要做的工作有字段篩選和數(shù)據(jù)清洗: 模型構(gòu)建部分,由于此問題是分類問題,選取了五個(gè)可以用于分類的模型進(jìn)行模型建置:貝式網(wǎng)絡(luò),決策樹,神經(jīng)網(wǎng)絡(luò),邏輯斯回歸,K-最鄰近。 對(duì)比不同模型的表現(xiàn)效果,使用F-Measure進(jìn)行模型效果評(píng)估。 模型應(yīng)用,使用決策樹模型進(jìn)行預(yù)測(cè)測(cè)試集客戶是否會(huì)流失。
最后,提出改進(jìn)建議。
心得分享也很有趣。
|
|
|