6個知識點【數據分析師】必備


怎么根據現有產品數據來做一次數據分析呢?以下幾個方向供大家參考學習:
 

界定數據分析的目的與實現

 

數據分析之前,我們要界定好此次分析的目的,一般我們分析數據有四種目的:

  • 戰略決策

  • 投資決策

  • 營銷決策

  • 產品決策

 

數據分析是一個積累的過程,數據也是一樣,數據從小到大,從少到多,數據從量變開始質變,并且體現在多個方面,觸發蝴蝶效應,推動其他領域的變化。

 

1. 催發數據性思維

 

數據性思維表現在:

  • 對全部數據進行分析,而不是隨機抽樣

  • 并不過于追求精確性,而是重視數據的復雜性

  • 更多挖掘數據的相關性,而不是因果

  • 數據之間的關聯關系

 

2. 產出“數據資產”

 

數據不斷的累計和整合,使得數據變成無形資產,使數據逐步幫助企業做決策,幫助產品設計導方向,改變運營策略。

 

3. 數據資產可以變現

 

數據可以像商品一樣可以進行售賣,數據變現使得數據有了價值,然而,不同數據,不同數據質量也具有不同價值,但數據的價值卻是客官存在的。

 

數據分析,永遠都是為了產品發展而服務,一切目的不外乎:獲得用戶、留住用戶、增加收益、擴大品牌知名度,而數據正驗證我們的設想,同樣,數據分析也是最客觀和準確的途徑,為決策做基礎。從數據的產生到分析、整理、展現、利用、再循環利用,這是大數據思維方式的轉變也是商業化新模式的開始。我們所要做的數據分析,不外乎就是將數據利用再利用的過程。

 

什么是數據分析

 

數據是由什么組成的?一個數據單元有多大?怎樣產生和傳送?數據不是憑空而來,數據是一個場景,一個業務,一個應用產生而來,數據的價值是它產生的環境,過程的獨特屬性而賦予的。數據不同屬性,造成了數據價值的差異性及應用層面的差異性。

 

舉個栗子——金融屬性數據

你的月收入,信用卡消費.網購消費.房貸車貸等,都形成了一個金融數據體系,金融數據的產生過程離錢越近也越有價值,它可以直接可以利用為征信,金融風控,貸款信用額度等。同樣,我們每天上網看信息、社交、聽歌、打游戲、搜索、看視頻等等,都會產生很多行為、偏好、社交屬性數據,通過這些數據我們可以勾畫出一個人的用戶畫像。

 

數據分析首先的問題就是識別數據,然后再弄清楚什么是數據分析,常見的數據有:

 

1. 網站

 

流量——PV——UV——點擊量——點擊率(CTR)——展示數——人均訪問量、CPM、CPC、轉化率、停留時間。

 

2. APP

 

日、周、月活量——留存率、屏顯

 

數據分析就是將產品相關的數據進行收集利用工具軟件整合,然后利用特定的方法進行分析,從中發現規律或得到結論。數據的數量不等于數據的質量,所以數據在收集之后必須進行整理、分析。因為,由于數據來源的零散、沒有結構、沒有規劃、沒有固定目的,導致即便數據再多,如果盲目用在特定的目標上,也必然產生缺乏質量的問題。只有經過嚴密的富有邏輯的整理、分析、關聯,才可以作為預測的根據,這就是我們識別數據的重要性。只有,明白數據從何而來,才能知道它走向何處。

 

 

怎么做數據分析

有了數據,一堆的數據看起來很大,很亂,我們需要針對性的選擇不同的方式方法來進行整合,以下介紹數據分析方法論。

 

數據分析方法:

  • 對比分析——橫切對比、縱切對比、目標對比、時間對比

  • 分類分析

  • 分布分析

  • 相關分析——相關分析研究的是事物間的某種聯系,最常見的聯系就是因果分析。

 

對比、分類、分布、相關這4種基礎分析方法除了可以直接應用外,還可派生出很多衍生方法,這些衍生方法在企業經營決策中經常會用到。

 

以上方法簡淺易懂,眼花繚亂的東西很多,真正派上用場的卻看起來不那么炫酷,很多方法樸實無華卻能解決大量問題。

 

下面就簡單介紹幾種:

 

1. 細分

 

嚴格說,細分不是一種方法,卻是一切分析的根源。

 

細分有兩類——一種是一定條件下的區隔例如在頁面停留30s以上的訪客,或者只要某個市區的訪客等,其實就是過濾。

 

另一種是維度之間的交叉,如深圳地區的新訪客,即分類。

 

2. 熱圖及如圖對比

 

熱圖對于web,APP的分析都很重要,在web前端,過去一些解決不好的問題,比如只能看鏈接的被點擊情況,點擊位置錯位,對浮層部分點擊的標記,對鏈出鏈接的標記等等,現在已經有好的工具能夠解決。

 

要想熱圖用的好,一個很重要的點在于你幾乎不能單獨使用一個熱圖就想解決問題,在實際工作中,經常用到集中對比熱圖方法。

 

  • 其一,多種熱圖的對比分析,尤其是點擊熱圖(觸摸熱圖)、閱讀線熱圖、停屏熱圖的對比分析

  • 其二,細分人群的熱圖對比分析,例如:不同渠道、新老用戶、不同時段、AB測試的如圖對比等

  • 其三,深度不同的互動,所反應的熱圖也就是不同餓。

 

使用熱圖的一個重要方法——不僅僅只是看整體用戶的熱圖,更應該記得細分不同用戶組,查看不同組的熱圖區別。

 

3. 歸因分析法

 

對于廣告主而言,我需要明確廣告投放出去用戶是從哪個渠道來的,這個用戶的質量怎么樣,廣告購買和用戶獲取以及用戶在APP內之間的關系,這就算歸因。

 

歸因,是指在多種因素共同作用造成的某一結果時,各種因素應該占有造成該結果的多大的作用,即功勞應該如何分配以及貴歸宿于誰。

 

嚴格意義上講,歸因模型大約有10種左右,而歸因分類則大體分為單觸點和多觸點兩類。考慮到用戶購買某一樣東西的決策,可能受到多種因素影響,比如看到廣告了解到這個商品的存在,利用搜索,進一步了解這個商品,然后在某一渠道上看到這個產品的軟文等等,這些因素的綜合,讓一個人下定決心購買。因此,單一廣告渠道并不是你打開客戶的閘門,而是多種渠道作用的結果。

 

常見的歸因模型:

  • 最終互動模型:100%分配給轉化前用戶最后一次接觸的媒體,這樣也容易測量,但屬于單觸點模式,不完善,適合轉化型廣告主。

  • 首次互動模型:100%分配給第一次接觸的渠道,只考慮最初的品牌認知、不考慮轉化,適合全新品牌。

  • 時間衰退互動模型:配比按時間遞減,適合臨時促銷廣告。

  • 自定義互動模型:自定義個階段配比,適合銷售和品牌同樣重視的廣告。

 

歸因分析的前提是設置目標——各渠道共同的目標,目標在各種分析工具中都能夠較為簡單的定義;歸因分析的各個渠道,應該有共同的目標才可以進行歸因。

 

4. 溯源

 

經過反復的細分對比后,基本上可以確定問題所在,這時就需要和業務方確認是否因為某些業務動作導致的數據一出去,包括新版本上線,運營活動策劃優化等等。

 

如果仍沒有透徹,那么從細粒度查起,如:

  • 用戶日記分析

  • 用戶訪談

  • 網絡調研

  • 工作坊

 

 

為什么做數據分析

數據分析以量化的方式來分析業務問題并提出解決方案。

 

  • 建立量化體系——設計指標,建立指標體系,按照指標維度進行收斂。

  • 明確數據量化重點

  • 確保數據準確

  • 站在業務場景角度分析

 

量化數據是為了統一認知,并且保證路徑可回溯,可復制。

指標設計——以準確易懂為準則,集合統計學和業務效果的方法論。

 

常用的統計學工具:

  • 業務概括——平均數、中位數、眾數

  • 業務差異性——方差、標準差

  • 業務分布——頻數

 

以電商顧客質量分析為例:概況是我們看下顧客的平均支付金額,或者支付中位數,來了解顧客概括。如果想要了解這批顧客質量是都比較好還是參差不齊,則需要通過方差和標準差來描述。如果想要知道更詳細的內容,可以了解每個區間的用戶數是多少來判斷。

 

 

怎么使數據分析更有效果

在做數據分析的過程中,我們需要了解什么樣的數據展示才是對結果的最好展示,如果單純地去看一個數據是沒有太大意義的,數據本身也具有相應的欺騙性,比如從運營同學那得到了日新增用戶數1W,那么單純看這個數據沒有什么意義,我們可以說這個數據很好,因為看上去很大,但是你可能沒有看到同期的數據,有可能昨天的數據達到了2W。

 

1. 好文配好圖,要明確要表達的信息.根據數據選擇合適的圖標類型

 

2. 好的數據一定是首先最好是以比率的形式存在的,不要絕對數,要相對數據

 

對比才能更好的展現數據的可用性,對比的數據可以從互聯網資訊網站獲取也可以從競品數據中獲取,還可以從咨詢公司獲取,這樣經過對比分析以及得到的對比率是最具有說服力的。

 

3. 通過對比來判斷數據的好壞

 

我們將數據的日增長量做成一個折線圖,從折線圖我們就能看出這個數據是在高點還是在低點。通過對比,我們就會得知這個數據所處的位置是什么樣的。另外,通過對比不同的渠道,對比不同的版本,對比不同的用戶群等不同緯度的數據,都可以從側面反映出這個數據的真實情況。

 

4. 數據不是一成不變的情況,要動態的去看數據

 

單純只看一個點的數據情況是沒有意義的,我們要在數據中加入時間的緯度。引入一段單位的時間去看待數據整體的變化趨勢,這樣才能更為客觀的判斷產品的健康程度。

 

5. 根據數據分析場景進行數據展示

 

 

怎樣成為優秀數據分析

1. 分析要有深度

 

深度是指數據分析對企業的支持程度,當企業面臨決策難題時,數據分析若要有深度,則要全面回答3個問題:

  • 企業的現狀和問題是什么?

  • 問題為什么會產生?

  • 企業該怎么辦?

 

這3個問題若未答全,則分析的深度就會有所缺失。缺失深度,也就只看到表面的數據累計卻看不到本質的問題。可以從問題的本質出發,從“是什么”“為什么”“怎么辦”3個角度思考。

 

提問是思考的翅膀,善于提問,勤于思考,我們就能達到數據分析的深度,只有不斷的鍛煉和學習才能在深度深耕。

 

2. 數據要有可信度

 

可信度是指分析結果的可靠程度。要有信度,需滿足三個條件:對比要可比、差異要顯著、描述要全面。

 

(1)對比要可比

 

基礎數據基數要具有可比性,不能將基礎數據與其他數據進行混合對比,缺少對比的可能性。

 

(2)差異要顯著

 

在做精細化營銷時,往往要用數據來理解不同用戶的差異;根據差異性制定運營策略。差異化的數據更能描述問題,差異化的數據需要進行檢驗,常用的顯著性檢驗有T檢驗和方差分析。以方差分析舉栗子,操作如下

 

 

  • 組間差異用組間離差平方和SSA(每組均值與總均值之差的平方和)度量

  • 組間自由度為K-1(K為組數)

  • 組內差異用組內離差平方和SSE(每組中的個案與相應組的均值之差的平方和)度量

  • 組內自由度為N-K(N為總個案數)

  • 用于方差檢驗的是F統計量

 

要通過檢驗,即要得到組間存在顯著差異的結論,就要使差異主要來自于組間,使得SSA越大越好,SSE越小越好,反映在F統計量上,就是要F越大越好。大于多少?大于F的臨界值,相應的,F的相伴概率小于顯著性水平(默認顯著性水平為0.05)。

 

根據技術的計算與對比,方差分析告訴我們,透過現象看本質。

 

3. 描述要全面

 

當刻畫一組數據時,描述要全面——不僅要描述這組數據的一般水平,還要考慮到這組數據的波動水平。如果波動很大,一般水平對數據總體的代表性就會很差。只考慮一般水平而不考慮波動和差異,會使數據的可信度大大縮水。所以,數據分析要有深度和寬度,挖掘夠深,反過來看,就會出現一種漏斗模型,從深度看寬度,以兩種不同角度看問題,分析問題,使得結果更具有說服力。

 

4. 分析要有效度

 

效度,指的是效率和速度。數據分析速度越快、成本越低,則效度越高,成效越顯著。社交網絡分析能成為趨勢,是因為與傳統分析方法相比,社交網絡分析更效度。社交網絡分析思路是處在社交網絡中心且連接數目較多的中心群體比隨機人群更容易影響外界和受到外界的影響。

 

社交網絡分析由于在社交網絡中,中心群體比隨機人群更容易影響他人,因此只要使中心群體進行分析,就解決了源頭問題。社交網絡分析之所以優于傳統方法,在于它能夠抓住重點。中心群體和隨機人群相比,中心群體更重要,因此,社交網絡分析以中心群體作為研究對象。用重點單位來發現規律和趨勢,就能事半功倍,產生效度。

 

在效度方面,社交網絡分析之所以優于傳統方法,在于它能夠抓住重點。中心群體和隨機人群相比,中心群體更重要,因此,社交網絡分析以中心群體作為研究對象。用重點單位來發現規律和趨勢,就能事半功倍,產生效度。

 

5. 分析要有通度

 

數據分析前要找到分析的目標,帶著問題去分析,也就是了解前期數據分析的需求,后期,需要做數據回報才具有針對性,目的性。溝通的順暢度即通度,通度高低直接影響數據價值的發揮水平。

 

如何提高溝通效率不影響進度,有“三用三不用”原則:能用圖表就不用數據;能用圖片就不用文字;能用動態呈現就不用靜態展示。

 

  • 能用圖表就不用數據:一圖抵千言,圖比數據跟具有說服力。

  • 能用圖片就不使用文字:文字多了就容易誤導用戶,看著頭暈,跟不能形象表達目標。

  • 能用動態呈現不用靜態展示:在表達事物隨著時間的變化而變化時,動態呈現能還原真實,比靜態展示更能讓人們產生身臨其境之感。

    加入CPDA,系統提升數據分析能力!



国产精品一区二区久久不卡