如何用正確的方式看數據

數據本身沒有錯,錯的是用了不正確的方式來詮釋

Mike Pan
Jan 23, 2021

身為一個產品經理,自己產品的相關數據幾乎是每天都要花一點時間來關注的。

而這週聽了尹相志老師在商業思維學院的分享的「如何以數據管理思維問對問題」講座後,覺得對於數據要如何看,又有了多一層的體認。以下就簡單分享一下我覺得最重要的三個要點。

了解領域知識 (Domain Knowledge)

首先,在開始分析資料之前,要先了解領域知識 (Domain Knowledge),不然分析出來的結果可能會是一些這個領域裡面大家都知道的常識。

例如,一個電信合約可能會是兩年,所以如果在分析客戶流失率的時候沒有意識到這點,那得到的結論可能就會是:在合約的第 24 個月的流失率最高。但這其實是必然的結果,也是倒果為因了。

另一個倒果為因的案例則是在保險業,發現客戶更改地址後就會申請理賠。但事實是,客戶在搬家時不會想到要去更改地址,會是在需要理賠時才發現地址需要更改;而改地址的申請又會比理賠的申請先完成,所以造成了改完地址就會申請理賠的假象。

所以,我覺得在分析資料時,有沒有先了解領域知識,是最基本、最重要的一點,可以確保你真的了解這些數字背後的意義,不會只是分析出一些理所當然的常識。

關注人的行為,而不只是單一事件

單一事件最有名的案例,大概就是尿布啤酒這個經典案例了;而這其實是運用購物籃分析 (Basket Analysis) 所得到的結論,發現買了啤酒的人,有蠻大機率也會同時買尿布。

但,試想一個情境,如果今天我買啤酒是要參加聖誕趴,但系統卻還是無腦推薦我要不要順便買個尿布,那這顯然不是個太聰明的系統。

所以,講者也提到要專注的其實是人的行為,從他過往的行為來推測他是什麼樣的人。可能有些人買啤酒時會搭配尿布一起買,而有些人則是會搭配冰塊、或是下酒菜一起買,所以應該要從過往的行為,來決定要推薦什麼樣的商品。

而這個思路其實也可以同時用來處理一些比較特別的案例。例如媽媽的信用卡但其實都是兒子在刷,所以消費紀錄看起來就會完全不像持卡人的媽媽的行為;但如果有從消費行為進行分析的話,其實就會發現,依照這樣的行為模式應該要把這個持卡人視為青少年、而不是媽媽。

隨時保持敏感度、並多想一想

講者在這部分提到了,數據的走勢通常不會一夕之間驟變,如果有,那一定是發生了什麼狀況。

而狀況的類型,我覺得又可以分為兩種

  • 外部因素:這部分需要去思考在那個驟變的時空背景之下,是不是有什麼重大事件會造成數據產生變動,例如 2008的金融海嘯、或是這兩年的 COVID-19 等等。
  • 內部因素:通常會是數據的計算方式或取得方式產生了改變,造成數據產生變動,而這是有可能會在原始數據資料上面揭露的。這邊要特別注意的是,因為計算方式或取得方式有改變,所以改變前後的數據,可能會是無法直接比較的。

這篇文章提到的就是一個數據計算方式產生改變的案例:造神型的數據分析:解析政府真的降低「兒虐」人數?

心得

整場聽下來覺得講者提到的案例都很平易近人,不論對於剛接觸數據的初學者、或是已經有一些相關經驗,應該都能夠有些收穫。

但稍微比較可惜的是,當初報名的其中一個原因其實也是看到講座內容有包含「學習到數據視覺化如何輔佐做出正確的商業決策」,但講座最後 Q&A 時,講者提到視覺化這塊的確因為時間關係被刪減了大半,也希望以後還有機會聽到這部分的分享了。

(4/27:補上另一場數據視覺化的講座心得如下)

延伸閱讀:

如果對於上面 兒虐人數 這類議題與數據有興趣的話,其實還蠻推薦《台灣數據百閱》這本書,裡面有各種與台灣相關的數據的呈現與探討。

下面兩篇則是我的讀書心得、以及參加講座的感想。

謝謝您看到最後!
若您喜歡我的文章,歡迎留下一些留言、按下「拍手」給我支持、或是「Follow」我,讓我提供更多文章給您。

--

--

Mike Pan

偶爾兼差 UX, Researcher, Data Analyst 的科技業小 PM,喜歡觀察,並試著拆解生活中所看到的人事物