电竞比分网-中国电竞赛事及体育赛事平台

分享

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

 東西二王 2019-08-09

來(lái)源:中國(guó)統(tǒng)計(jì)網(wǎng)

“Why-What-How”在講解概念和執(zhí)行上是個(gè)不錯(cuò)的思維模型,本文依例按此框架來(lái)拆分?jǐn)?shù)據(jù)分析。很多小白可能還沒(méi)有數(shù)據(jù)分析的思路,這里權(quán)且從個(gè)人的角度進(jìn)行梳理,以資參考。為了幫助大家更好地理解本文,先貼出一張思維導(dǎo)圖:

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

一、WHY:為什么要做數(shù)據(jù)分析

個(gè)人的理解, 數(shù)據(jù)分析是為了能以量化的方式來(lái)分析業(yè)務(wù)問(wèn)題并得出結(jié)論,其中有兩個(gè)重點(diǎn)詞語(yǔ):量化和業(yè)務(wù)。

量化是為了統(tǒng)一認(rèn)知,并且確保路徑可回溯,可復(fù)制。除「量化」之外,另外一個(gè)重點(diǎn)詞語(yǔ)是「業(yè)務(wù)」。只有解決業(yè)務(wù)問(wèn)題分析才能創(chuàng)造價(jià)值,價(jià)值包括個(gè)人價(jià)值和公司價(jià)值。

那么,如何站在業(yè)務(wù)方的角度思考問(wèn)題呢,總結(jié)起來(lái)就是八個(gè)字「憂其所慮,給其所欲」:

  • 溝通充分
  • 結(jié)論簡(jiǎn)明
  • 提供信息量及可落地建議
  • 尋求反饋

在溝通上,確定業(yè)務(wù)方想要分析什么,提出更合理專業(yè)的衡量和分析方式,同時(shí)做好節(jié)點(diǎn)同步,切忌一條路走到黑。舉例來(lái)講,業(yè)務(wù)方說(shuō)要看頁(yè)面停留時(shí)長(zhǎng),但他實(shí)際想要的,可能是想衡量用戶質(zhì)量,那么留存率、目標(biāo)轉(zhuǎn)化率才是更合適的指標(biāo)。

在闡述分析結(jié)果上,要記得結(jié)論先行,逐層講解,再提供論據(jù)。因?yàn)闃I(yè)務(wù)方或管理層時(shí)間都是有限的,洋洋灑灑一大篇郵件,未看先暈,誰(shuí)都沒(méi)心思看你到底分析了啥。

在提供信息量及可落地建議上,先要明白什么叫信息量:提供了對(duì)方不知道的信息。太陽(yáng)明天從東方升起不算信息量,從西方升起才是。

二、WHAT:什么是數(shù)據(jù)分析

數(shù)據(jù)分析的本質(zhì)是抓住變與不變?!白儭笔菙?shù)據(jù)分析的基礎(chǔ),如果一個(gè)業(yè)務(wù)每天訂單是 10000 單,或者每天都是以 10% 的速度穩(wěn)步增長(zhǎng),那就沒(méi)有分析的必要了。而若想抓住變,得先形成“不變”的意識(shí)。

因此,我建議新手要形成習(xí)慣,每天上班第一時(shí)間查看數(shù)據(jù):實(shí)時(shí)&日周月報(bào);記錄關(guān)鍵數(shù)據(jù)(榜單&報(bào)告)

在“不變”的基礎(chǔ)上,便能逐漸培養(yǎng)出指標(biāo)敏感性,即意識(shí)指標(biāo)偏離的能力。這主要是通過(guò)各種日環(huán)比,周月同比的監(jiān)控以及日常的好奇心來(lái)保持。我們從一個(gè) Questmobile 榜單上,來(lái)簡(jiǎn)單看下「指標(biāo)偏離」是怎么應(yīng)用到日常的分析上的:

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

這里先跟大家分享下怎么看這種榜單:

  • 看整體排行:看哪些 APP 排在前方是出乎你意料之外的
  • 分行業(yè)看排行:看行業(yè)里排行及其變動(dòng)
  • 看增長(zhǎng)率:哪些 APP 增長(zhǎng)比較快
  • 看使用時(shí)長(zhǎng)等其他指標(biāo)

數(shù)據(jù)分析的定義,還有國(guó)外一本商務(wù)分析的書籍的定義作為注腳:

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

三、HOW:怎么進(jìn)行數(shù)據(jù)分析

任何數(shù)據(jù)分析都是“細(xì)分,對(duì)比,溯源”這三種行為的不斷交叉。最常見的細(xì)分對(duì)比維度是時(shí)間,我們通過(guò)時(shí)間進(jìn)行周月同比,發(fā)現(xiàn)數(shù)據(jù)異常后,再進(jìn)行維度或流程上的細(xì)分,一步步拆解找到問(wèn)題所在。

1、細(xì)分

在細(xì)分方式上,主要有以下三種方式

  • 橫切:根據(jù)某個(gè)維度對(duì)指標(biāo)進(jìn)行切分及交叉分析
  • 縱切:以時(shí)間變化為軸,切分指標(biāo)上下游
  • 內(nèi)切:根據(jù)某個(gè)模型從目標(biāo)內(nèi)部進(jìn)行劃分

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

橫切

橫切上,我們對(duì)維度和指標(biāo)做做了分類和交叉,當(dāng)某一類的指標(biāo)出現(xiàn)問(wèn)題時(shí),我們便知道該從什么維度進(jìn)行分析。在進(jìn)行橫切分析時(shí),經(jīng)常需要多個(gè)維度交叉著使用。

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

縱切

縱切上,有目的有路徑,則用漏斗分析。無(wú)目的有路徑,則用軌跡分析。無(wú)目的無(wú)路徑,則用日志分析。

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

內(nèi)切

內(nèi)切上,主要是根據(jù)現(xiàn)有市面上常見的分析模型,RFM,Cohort 和 Segment等方式進(jìn)行分析。RFM 即最近購(gòu)買時(shí)間,頻率及金額三個(gè)指標(biāo)綜合來(lái)判定用戶忠誠(chéng)度及粘性。

2、對(duì)比

對(duì)比主要分為以下幾種:

  • 橫切對(duì)比:根據(jù)細(xì)分中的橫切維度進(jìn)行對(duì)比,如城市和品類
  • 縱切對(duì)比:與細(xì)分中的縱切維護(hù)進(jìn)行對(duì)比,如漏斗不同階段的轉(zhuǎn)化率
  • 目標(biāo)對(duì)比:常見于目標(biāo)管理,如完成率等
  • 時(shí)間對(duì)比:日環(huán)比,周月同比;7天滑動(dòng)平均值對(duì)比,7天內(nèi)極值對(duì)比

3、溯源

經(jīng)過(guò)反復(fù)的細(xì)分對(duì)比后,基本可以確認(rèn)問(wèn)題所在了。這時(shí)候就需要和業(yè)務(wù)方確認(rèn)是否因?yàn)槟承I(yè)務(wù)動(dòng)作導(dǎo)致的數(shù)據(jù)異常,包括新版本上線,或者活動(dòng)策略優(yōu)化等等。

如果仍然沒(méi)有頭緒,那么只能從最細(xì)顆粒度查起了,如用戶日志分析、用戶訪談、外在環(huán)境了解,如外部活動(dòng),政策經(jīng)濟(jì)條件變化等等

4 、衍生模型

在「細(xì)分對(duì)比」的基礎(chǔ)上,可以衍生出來(lái)很多模型。這些模型的意義是能夠幫你快速判斷一個(gè)事情的關(guān)鍵要素,并做到不重不漏。這里列舉幾個(gè)以供參考:

  • Why-How-What
  • 5W1H
  • 5Why
  • 4P模型(產(chǎn)品,價(jià)格,渠道,宣傳)
  • SWOT 模型(優(yōu)勢(shì),劣勢(shì),機(jī)會(huì),威脅)
  • PEST 模型(政治,經(jīng)濟(jì),社會(huì),科技)
  • 波士頓矩陣

四、How:數(shù)據(jù)分析如何落地

以上講的都偏「道術(shù)技」中的「術(shù)」部分,下面則通過(guò)匯總以上內(nèi)容,和實(shí)際工作進(jìn)行結(jié)合,落地成「技」部分。

1、數(shù)據(jù)分析流程和場(chǎng)景

根據(jù)不同的流程和場(chǎng)景,會(huì)有些不同的注意點(diǎn)和「術(shù)」的結(jié)合

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

2、數(shù)據(jù)分析常見謬誤

控制變量謬誤:在做 A/B 測(cè)試時(shí)沒(méi)有控制好變量,導(dǎo)致測(cè)試結(jié)果不能反映實(shí)驗(yàn)結(jié)果?;蛘咴谶M(jìn)行數(shù)據(jù)對(duì)比時(shí),兩個(gè)指標(biāo)沒(méi)有可比性。

樣本謬誤:在做抽樣分析時(shí),選取的樣本不夠隨機(jī)或不夠有代表性。舉例來(lái)講,互聯(lián)網(wǎng)圈的人會(huì)發(fā)現(xiàn)身邊的人幾乎不用「今日頭條」,為什么這 APP 還能有這么大瀏覽量?

定義謬誤:在看某些報(bào)告或者公開數(shù)據(jù)時(shí),經(jīng)常會(huì)有人魚目混珠?!妇W(wǎng)站訪問(wèn)量過(guò)億」,是指的訪問(wèn)用戶數(shù)還是訪問(wèn)頁(yè)面數(shù)?

比率謬誤:比率型或比例型的指標(biāo)出現(xiàn)的謬誤以至于可以單獨(dú)拎出來(lái)將。一個(gè)是每次談?wù)摯祟愋椭笜?biāo)時(shí),都需要明確分子和分母是什么。

因果相關(guān)謬誤:會(huì)誤把相關(guān)當(dāng)因果,忽略中介變量。比如,有人發(fā)現(xiàn)雪糕的銷量和河溪溺死的兒童數(shù)量呈明顯相關(guān),就下令削減雪糕銷量。其實(shí)可能只是因?yàn)檫@兩者都是發(fā)生在天氣炎熱的夏天。

辛普森悖論:簡(jiǎn)單來(lái)說(shuō),就是在兩個(gè)相差較多的分組數(shù)據(jù)相加時(shí),在分組比較中都占優(yōu)勢(shì)的一方,會(huì)在總評(píng)中反而是失勢(shì)的一方。

寫給數(shù)據(jù)分析小白:一種通用的數(shù)據(jù)思維

總結(jié)

數(shù)據(jù)準(zhǔn)確性是第一位的,站在業(yè)務(wù)方的角度思考問(wèn)題:憂其所慮,予其所欲,定義「變」與「不變」,細(xì)分,對(duì)比,溯源。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多