“Why-What-How”在講解概念和執(zhí)行上是個(gè)不錯(cuò)的思維模型,本文依例按此框架來(lái)拆分?jǐn)?shù)據(jù)分析。很多小白可能還沒(méi)有數(shù)據(jù)分析的思路,這里權(quán)且從個(gè)人的角度進(jìn)行梳理,以資參考。為了幫助大家更好地理解本文,先貼出一張思維導(dǎo)圖: 一、WHY:為什么要做數(shù)據(jù)分析個(gè)人的理解, 數(shù)據(jù)分析是為了能以量化的方式來(lái)分析業(yè)務(wù)問(wèn)題并得出結(jié)論,其中有兩個(gè)重點(diǎn)詞語(yǔ):量化和業(yè)務(wù)。 量化是為了統(tǒng)一認(rèn)知,并且確保路徑可回溯,可復(fù)制。除「量化」之外,另外一個(gè)重點(diǎn)詞語(yǔ)是「業(yè)務(wù)」。只有解決業(yè)務(wù)問(wèn)題分析才能創(chuàng)造價(jià)值,價(jià)值包括個(gè)人價(jià)值和公司價(jià)值。 那么,如何站在業(yè)務(wù)方的角度思考問(wèn)題呢,總結(jié)起來(lái)就是八個(gè)字「憂其所慮,給其所欲」:
在溝通上,確定業(yè)務(wù)方想要分析什么,提出更合理專業(yè)的衡量和分析方式,同時(shí)做好節(jié)點(diǎn)同步,切忌一條路走到黑。舉例來(lái)講,業(yè)務(wù)方說(shuō)要看頁(yè)面停留時(shí)長(zhǎng),但他實(shí)際想要的,可能是想衡量用戶質(zhì)量,那么留存率、目標(biāo)轉(zhuǎn)化率才是更合適的指標(biāo)。 在闡述分析結(jié)果上,要記得結(jié)論先行,逐層講解,再提供論據(jù)。因?yàn)闃I(yè)務(wù)方或管理層時(shí)間都是有限的,洋洋灑灑一大篇郵件,未看先暈,誰(shuí)都沒(méi)心思看你到底分析了啥。 在提供信息量及可落地建議上,先要明白什么叫信息量:提供了對(duì)方不知道的信息。太陽(yáng)明天從東方升起不算信息量,從西方升起才是。 二、WHAT:什么是數(shù)據(jù)分析數(shù)據(jù)分析的本質(zhì)是抓住變與不變?!白儭笔菙?shù)據(jù)分析的基礎(chǔ),如果一個(gè)業(yè)務(wù)每天訂單是 10000 單,或者每天都是以 10% 的速度穩(wěn)步增長(zhǎng),那就沒(méi)有分析的必要了。而若想抓住變,得先形成“不變”的意識(shí)。 因此,我建議新手要形成習(xí)慣,每天上班第一時(shí)間查看數(shù)據(jù):實(shí)時(shí)&日周月報(bào);記錄關(guān)鍵數(shù)據(jù)(榜單&報(bào)告) 在“不變”的基礎(chǔ)上,便能逐漸培養(yǎng)出指標(biāo)敏感性,即意識(shí)指標(biāo)偏離的能力。這主要是通過(guò)各種日環(huán)比,周月同比的監(jiān)控以及日常的好奇心來(lái)保持。我們從一個(gè) Questmobile 榜單上,來(lái)簡(jiǎn)單看下「指標(biāo)偏離」是怎么應(yīng)用到日常的分析上的: 這里先跟大家分享下怎么看這種榜單:
數(shù)據(jù)分析的定義,還有國(guó)外一本商務(wù)分析的書籍的定義作為注腳: 三、HOW:怎么進(jìn)行數(shù)據(jù)分析任何數(shù)據(jù)分析都是“細(xì)分,對(duì)比,溯源”這三種行為的不斷交叉。最常見的細(xì)分對(duì)比維度是時(shí)間,我們通過(guò)時(shí)間進(jìn)行周月同比,發(fā)現(xiàn)數(shù)據(jù)異常后,再進(jìn)行維度或流程上的細(xì)分,一步步拆解找到問(wèn)題所在。 1、細(xì)分 在細(xì)分方式上,主要有以下三種方式
橫切 橫切上,我們對(duì)維度和指標(biāo)做做了分類和交叉,當(dāng)某一類的指標(biāo)出現(xiàn)問(wèn)題時(shí),我們便知道該從什么維度進(jìn)行分析。在進(jìn)行橫切分析時(shí),經(jīng)常需要多個(gè)維度交叉著使用。 縱切 縱切上,有目的有路徑,則用漏斗分析。無(wú)目的有路徑,則用軌跡分析。無(wú)目的無(wú)路徑,則用日志分析。 內(nèi)切 內(nèi)切上,主要是根據(jù)現(xiàn)有市面上常見的分析模型,RFM,Cohort 和 Segment等方式進(jìn)行分析。RFM 即最近購(gòu)買時(shí)間,頻率及金額三個(gè)指標(biāo)綜合來(lái)判定用戶忠誠(chéng)度及粘性。 2、對(duì)比 對(duì)比主要分為以下幾種:
3、溯源 經(jīng)過(guò)反復(fù)的細(xì)分對(duì)比后,基本可以確認(rèn)問(wèn)題所在了。這時(shí)候就需要和業(yè)務(wù)方確認(rèn)是否因?yàn)槟承I(yè)務(wù)動(dòng)作導(dǎo)致的數(shù)據(jù)異常,包括新版本上線,或者活動(dòng)策略優(yōu)化等等。 如果仍然沒(méi)有頭緒,那么只能從最細(xì)顆粒度查起了,如用戶日志分析、用戶訪談、外在環(huán)境了解,如外部活動(dòng),政策經(jīng)濟(jì)條件變化等等 4 、衍生模型 在「細(xì)分對(duì)比」的基礎(chǔ)上,可以衍生出來(lái)很多模型。這些模型的意義是能夠幫你快速判斷一個(gè)事情的關(guān)鍵要素,并做到不重不漏。這里列舉幾個(gè)以供參考:
四、How:數(shù)據(jù)分析如何落地以上講的都偏「道術(shù)技」中的「術(shù)」部分,下面則通過(guò)匯總以上內(nèi)容,和實(shí)際工作進(jìn)行結(jié)合,落地成「技」部分。 1、數(shù)據(jù)分析流程和場(chǎng)景 根據(jù)不同的流程和場(chǎng)景,會(huì)有些不同的注意點(diǎn)和「術(shù)」的結(jié)合 2、數(shù)據(jù)分析常見謬誤 控制變量謬誤:在做 A/B 測(cè)試時(shí)沒(méi)有控制好變量,導(dǎo)致測(cè)試結(jié)果不能反映實(shí)驗(yàn)結(jié)果?;蛘咴谶M(jìn)行數(shù)據(jù)對(duì)比時(shí),兩個(gè)指標(biāo)沒(méi)有可比性。 樣本謬誤:在做抽樣分析時(shí),選取的樣本不夠隨機(jī)或不夠有代表性。舉例來(lái)講,互聯(lián)網(wǎng)圈的人會(huì)發(fā)現(xiàn)身邊的人幾乎不用「今日頭條」,為什么這 APP 還能有這么大瀏覽量? 定義謬誤:在看某些報(bào)告或者公開數(shù)據(jù)時(shí),經(jīng)常會(huì)有人魚目混珠?!妇W(wǎng)站訪問(wèn)量過(guò)億」,是指的訪問(wèn)用戶數(shù)還是訪問(wèn)頁(yè)面數(shù)? 比率謬誤:比率型或比例型的指標(biāo)出現(xiàn)的謬誤以至于可以單獨(dú)拎出來(lái)將。一個(gè)是每次談?wù)摯祟愋椭笜?biāo)時(shí),都需要明確分子和分母是什么。 因果相關(guān)謬誤:會(huì)誤把相關(guān)當(dāng)因果,忽略中介變量。比如,有人發(fā)現(xiàn)雪糕的銷量和河溪溺死的兒童數(shù)量呈明顯相關(guān),就下令削減雪糕銷量。其實(shí)可能只是因?yàn)檫@兩者都是發(fā)生在天氣炎熱的夏天。 辛普森悖論:簡(jiǎn)單來(lái)說(shuō),就是在兩個(gè)相差較多的分組數(shù)據(jù)相加時(shí),在分組比較中都占優(yōu)勢(shì)的一方,會(huì)在總評(píng)中反而是失勢(shì)的一方。 總結(jié)數(shù)據(jù)準(zhǔn)確性是第一位的,站在業(yè)務(wù)方的角度思考問(wèn)題:憂其所慮,予其所欲,定義「變」與「不變」,細(xì)分,對(duì)比,溯源。 |
|
|
來(lái)自: 東西二王 > 《數(shù)據(jù)分析》