一般聊到如何做數據分析的文章,都會從各個視角去介紹數據分析的思路和流程。但今天這篇文章,不會告訴你怎么按1234的步驟做數據分析,而是告訴你在數據分析中,不要做什么。

正如查理芒格所言:“在生活和事業中,很多成功都來自于你避免了某些事情:比如早逝、糟糕的婚姻等。” 我相信,和“要做到好而深入的數據分析”相比,“不在數據分析中踩坑”會是更易于執行的事情,這是也這篇文章的誕生原因。

以下的錯誤集合,都是從身邊的真實案例總結而來的。從錯誤出發,也會給出我們認為正確的做法和思路,希望能對大家的真實工作場景有所啟發。

錯誤1:最后一刻才想起要數據分析

典型的場景是,領導和你說:明天交一個總結ppt給我。這時候你才想起來去提數和分析,很可能為時已晚。如果是常規的數據可以看內部的數據平臺去獲取;但如果是個性化的看數需求,就必須經歷以下這些步驟:確定埋點方案、開發埋點、與數據分析師的具體提數需求溝通、實際提數、整理數據、最終分析。在這么長的鏈路中,如果有哪一步漏了,都有可能導致你拿不到想要的數據。

解法:從項目初始階段便需要有數據思維

想做數據分析?先避開這4個新手常見的錯誤!

正確的方式是怎樣的呢?應該是從項目開始,就根據你的方案,去定義你應該看什么數據來衡量最終的設計成敗。這樣一來的好處是,首先會倒逼我們從考慮方案的時候,就專注于能帶來實際數據提升的方案,避免自嗨型方案、沒有辦法衡量結果成敗的方案;其次是這樣才能保證,我們在埋點的時候不會漏掉本該埋的數據,避免最終上線出現沒有埋數據,導致無法衡量結果的情況。

錯誤2:對基礎數據指標的定義不了解

不了解基本的數據指標概念,也是一個常犯的錯誤。例如說我們常遇到團隊中的新人會有這樣的疑問:客單價和 UV 價值有什么差別?UV 點擊率和曝光點擊率有什么差別?這就是對于數據指標的基本概念理解不足造成的。如果連指標都的含義都沒有了解清晰,對于進一步的數據分析一頭霧水也是難免的。

解法:從定義來初步認識,從影響因素和場景來加深理解

首先,最簡單粗暴的方式,就是通讀指標解釋。一般數據平臺都有地方專門解釋這個指標的背后公式,這些解釋會幫助我們建立對不同指標的初步理解。之前也寫過一篇文章《電商設計,你必須懂的10條數據指標》,希望能加深大家對于數據指標的理解。

想做數據分析?先避開這4個新手常見的錯誤!

更進一步,有兩個角度可以嘗試去思考。?例如以客單價和單 UV 價值的案例來說,第一個角度,是看這個指標的關鍵影響因素。像客單價,是更容易受到貨的屬性影響的,奢侈品的客單價天然就會趨向于比消費品的客單價更高;單 UV 價值,更容易受到流量質量的影響,比如把促銷敏感型的用戶導入了奢侈品的頻道,這個時候,一般 UV 價值是會極低的,而客單價可能沒有太大的變化。第二個角度是看這個數據指標的使用場景。如客單價,可以用來看這個業務的品類特征如何,UV 價值,是用來看流量與業務匹配度,以及判斷業務的潛力。比如,看要不要給到這個業務更多的資源,就可以看 UV 價值,因為 UV 價值高,就代表了給這個地方更多的同類流量,它的 GMV 就會更高。?

錯誤3:分析邏輯鏈缺失

一個典型的案例,是只看了 GMV 上漲,就下定論說代表我的策略是成功的。為什么有問題呢?因為 GMV 上漲是各種變量綜合導致的結果,如果不去深入分析其中到底是什么變量導致了 GMV 上漲,是不能直接跳過中間的邏輯鏈去下判斷的。

解法:拆公式、拆鏈路

想做數據分析?先避開這4個新手常見的錯誤!

首先是從公式上直接開始分析。假設你之前的策略是提升轉化率——那么在如上圖的公式拆解中,雖然最終的gmv是提升的,但因為gmv提升主要是由瀏覽UV的提升帶來的,因此轉化率相關的策略可以說是失敗了。

想做數據分析?先避開這4個新手常見的錯誤!

第二個思路,是由宏觀到微觀的方式去排查問題的方式。電商場景中,我們可以先看交易數據,看下是否達到了當初的預期,與歷史對比是漲還是跌;然后再看流量數據,因為流量是影響 gmv的最大因素之一,這時候就可以分析交易數據的漲跌,是否是因流量的漲跌導致的;或者說是流量質量導致的轉化率低等等;如果分析完,發現流量的影響不大,這時候可以進入下一級,去分析核心的節點是否存在問題。比如在電商黃金流程場景中,我們看搜索、商詳、加購等核心頁面的漏斗;而在大促場景中,我們可能會去看主會場的主推樓層們是否達成了預期的產出。這個就是以宏觀到微觀去排查問題的思路。

錯誤4:只抓了一條變量,忽略其他關鍵變量

有時候,我們的分析看起來有理有據、是有數據支撐的,初步看起來邏輯沒有大問題。例如說,根據以下這個點擊率的圖表,似乎可以直接推測出這個頁面里,除了XX樓層以外,其他的樓層表現不佳。于是我們可以直接下結論說:未來還做這樣的頁面的時候,迭代的方向,就是直接把表現不佳的樓層去掉,只留下這個表現好的樓層了嗎?——這樣的結論是失之輕率的。那到底問題出在哪里呢?

想做數據分析?先避開這4個新手常見的錯誤!

問題在于:我們似乎建立了一個前提,即這樣的數據結論是僅僅源自“樓層的定位或者設計”這一個變量而導致的。因此數據好=樓層的定位和設計成功,要延續;數據差=樓層的定位和設計成功,要復用。但是現實情況,永遠比我們設想的要復雜。僅抓了一條變量就貿然下結論,風險是比較大的。

解法:找到各種關鍵變量,排除或確認這個變量的影響

回到真實業務場景,會發現還有更多變量。在這個案例中,我們第二個要考慮的變量,是流量渠道。以上圖表是APP的樓層數據,那么M端是否是一樣的趨勢呢?拉出來M端的點擊率圖表一看,會發現趨勢完全是不一致的:

想做數據分析?先避開這4個新手常見的錯誤!

此時有了第一個猜測:APP端流量更多內部自流量,M端更多外推流量,因此我們可以得出,這個點擊率反映的是JD自有流量和外推流量對于這個頁面完全不同的行為特征。

那為什么外推帶來的用戶和站內的用戶,對同一個頁面的需求差異那么大呢?因為這是一個以 IP 內容為主的頁面,頁面大部分區域都是 IP類商品,是帶有一定粉絲向的。直到頁面很下方才有非 IP 角度的商品,這里的商品是全品類的。說到這里,大家應該意識到了:這里還有第三個變量——樓層的內容差異。此時把第二個變量與第三個變量交叉判斷,就是本次數據分析的關鍵問題:樓層內容與流量渠道的匹配度高低。

想做數據分析?先避開這4個新手常見的錯誤!

根據上面的分析,我們可以得出最終的結論:

  • 外推帶來的用戶,對于頁面的主推 IP 內容更感興趣,說明本次外推觸達的用戶是更精準符合這個頁面的用戶群體;
  • 而站內的用戶,對于頁面的主推內容是缺乏興趣的,只有看到全品類樓層才有興趣,說明站內自有流量與本次 IP 頁面不太匹配;
  • 綜上,在后續進行同類的 IP 頁面的運營活動時,若想要達成更精準的人貨匹配,建議把流量重點放在外推的流量上,而降低對站內流量的效果的預期。

以上就是一次如何排除各自變量影響的分析案例。基本的思路是:不要滿足于你手上抓住的那條變量,而是盡可能多地找到這個場景里的關鍵變量,再一個個變量去排除或者確認它的影響,最終才得到較合理的結論。

小結:跨過分析門檻→深挖分析深度

總結以上的問題,發現這些問題本質上是從分析小白→到分析進階者之間遇到的一些門檻。就如下圖一樣,要輸出一份符合邏輯、能對業務有實際幫助的數據分析,我們就需要避免踩到這些坑。

想做數據分析?先避開這4個新手常見的錯誤!

而我們的解法,就只有踏實做好以下的事情:

  • 在全鏈路有數據意識,避免在最后一步才想起要數據分析;
  • 對數據指標有基本認識,避免拿著指標一頭霧水;
  • 分析時要有溯源邏輯,避免僅通過一個指標判斷成敗;
  • 窮舉各種可能的變量,避免只抓到一個變量就下判斷。

以上就是關于數據分析如何才能不踩坑的個人心得,如果有任何數據相關問題想討論,歡迎在文章下方留言~

歡迎關注「JellyDesign」的小程序:

想做數據分析?先避開這4個新手常見的錯誤!

收藏 75
點贊 8

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。