為資料選擇適合的視覺化方式

好的資料視覺化帶你上天堂

Mike Pan
9 min readApr 26, 2021

上週在商業思維學院聽了尹相志老師的講座「有感的商業決策從數據與視覺化開始」。而在開頭介紹資料視覺化的幾種圖表時,發現蠻多人對於要如何選擇適合的圖表來進行資料呈現,蠻都是感到比較苦手的,所以也想說把很久以前整理過的一些資料再拿出來和大家分享一下。

為什麼需要資料視覺化

首先來看一下 Wikipedia 對於資料視覺化的說明

為了清晰有效地傳遞資訊,資料視覺化使用統計圖形、圖表、資訊圖表和其他工具。可以使用點、線或條對數字資料進行編碼,以便在視覺上傳達定量資訊。有效的視覺化可以幫助用戶分析和推理資料和證據。它使複雜的資料更容易理解、理解和使用。

好的資料視覺化絕對會有相輔相成的效果,讓資料的 insight 更容易被看見與理解;而不適當的資料視覺化、或是選擇了錯誤圖表來呈現,則可能會讓大家無法看見資料的重點,甚至對資料產生誤解。

所以,應該是說將這些資料用表格或文字來呈現當然也可以,但資料視覺化會是個更好的方式,因為人類就是視覺的動物 (以下數據的資料來源附在文章最後面)。

  • 大腦吸收圖像的速度,比吸收文字快 60000 倍。
  • 圖像式的內容比起純文字,可以多吸引 94% 的目光。
  • 90% 的資訊是透過圖像進入到大腦中。
  • 人類可以從圖像訊息中吸收 80% 的內容,只能從文字訊息中吸收 20%。
  • 65% 的人是透過圖像學習。

視覺化圖表類型

而這篇文章就是來跟大家簡單介紹一下資料視覺化的圖表類型。

就從下面這張圖表類型 (圖片來源) 作為開始吧,這幾乎就包含所有我們日常生活中會遇得到的各種圖片類型了,其實也是尹相志老師在講座中使用的素材。

首先從畫面中間的 What would you like to show 出發,可以分成幾種類型:

  • 首先是畫面上方的 Comparison,呈現不同資料的比較情況。
  • 再來是畫面下方的 Composition,用來呈現資料的組成情況。
  • 最後則是畫面左右兩側的 RelationshipDistribution,這兩個類型會一起進行介紹,主要是我覺得分佈方式 (Distribution) 某種程度上也是闡述資料的關係 (Relationship),加上圖表種類相對較少。

Comparison:呈現不同資料比較情況的圖表

與時間趨勢相關的比較

首先,我覺得最常看到的比較,就是和時間趨勢有關的,通常用以下三種圖表可以解:

  • 折線圖 (Line Chart)
  • 面積圖 (Area Chart)
  • 長條圖 (Bar Chart)

這幾個圖表,最大的共同特點就是用 X 軸來代表時間維度。

例如下方的六都房價走勢折線圖 (圖片來源),對於要同時呈現多組不同資料隨著時間走勢的變化,也是能夠駕馭的。

面積圖長條圖則會比較用來呈現單一組資料、或最多兩到三組資料隨時間走勢的變化。例如下面兩張圖就分別只呈現美國和蘇俄的核武數量隨著年份的變動情況,只是分別以面積圖 (圖片來源) 與長條圖進行呈現 (圖片來源)。

不同資料之間的比較

簡單來說,其實也可以視為與時間趨勢無關的比較,通常用下面三種圖表可以解:

  • 長條圖 (Bar Chart)
  • 直方圖 (Histogram)
  • 雷達圖 (Radar Chart)

例如下面的長條圖就是比較各國的人均 GDP (圖片來源),而針對一些想要呈現的重點也可以再用不同顏色進行區別,更容易進行辨識。

下圖左右則分別是直方圖雷達圖。直方圖這邊就是常見的人口金字塔 (圖片來源),這其實可以視為是男性與女型人口分布的兩個直方圖,再組合而成的;而雷達圖 (圖片來源) 則通常是用來呈現某事物在不同面向的評分。

簡單來說,Comparison 裡面的兩種類型,差別就在於是否是時間維度有關。

  • 與時間維度有關的,通常是比較不同時間的相同資料 (例如某國家的 GDP 走勢)。
  • 與時間維度無關的,通常就是比較不同類別的資料 (例如各國在某年的 GDP 比較)。

一個比較簡單的辨別方式,其實就是看 X 軸是否代表時間維度。

Composition:呈現資料組成情況的圖表

最常見的大概是以下這幾種圖表類型了:

  • 圓餅圖 (Pie Chart) / 甜甜圈圖 (Donut Chart)
  • 堆疊長條圖 (Stacked Bar Chart)
  • 樹狀結構圖 (Treemap) / 瀑布圖 (Waterfall Chart)

首先是圓餅圖甜甜圈圖。圓餅圖大家應該都不陌生,而通常如果要呈現比較多層次的資料,就會改成使用甜甜圈圖。例如下面的歐盟總預算使用比例 (圖片來源)、以及瀏覽器市佔率 (圖片來源)。

再來則是長條圖,沒錯,長條圖又出現了!在呈現資料組成情況的時候,主要會使用到的則是堆疊長條圖,又可以再細分為以下兩類 (圖片來源)。

  • 絕對數量堆疊長條圖:如下圖左,呈現各組成成分的絕對數量。
  • 百分比堆疊長條圖:如下圖右,呈現各組成成分的相對佔比。

例如下方的堆疊長條圖,比較的就是各種消費者對於各種行銷管道的信任程度 (圖片來源)。

也有一派說法是用圓餅之中扇形的角度來呈現比例其實沒有那麼直覺,應該盡量使用堆疊長條圖這種方式來做呈現。我是覺得圓餅圖和甜甜圈圖其實還是有他們適合的情境,比如說上面多層次的組成結構,就還算蠻適合的。所以也建議可以將資料試著用不同圖表呈現看看,再來挑選最適合的方式。

最後則是樹狀結構圖瀑布圖,這兩種圖表除了組成比例之外,通常都還帶有其他的屬性,例如呈現正負值等等。最常見的瀑布圖大概就是股票走勢了,例如下圖這張 (圖片來源) 還另外結合了盒鬚圖 (Box & Whisker Chart) 在每個資料點進行更細部的呈現。

下面則是樹狀結構圖的範例,Florida 2016 的投票情況 (圖片來源);除了資料的組成比例,還另外呈現了候選人的傾向。

Relationship & Distribution:呈現資料分布情況的圖表

這邊一樣主要有三種常見的圖表類型:

  • 散佈圖 (Scatter Plot)
  • 泡泡圖 (Bubble Chart)
  • 盒鬚圖/箱型圖 (Box & Whisker Chart)

首先是散佈圖,通常用來觀察一大群資料點的分佈情況,看是否有些趨勢或分群隱藏在其中。有時候也會加上輔助線做呈現,可以更凸顯想要表達的重點,例如下圖男性與女性的身高體重分布 (圖片來源)。

再來則是泡泡圖,其實有點類似散佈圖,只是將散佈圖上面的點變成圓圈,以便用圓圈的大小來呈現資料量這個散佈圖無法呈現的維度,例如下圖北美各城市科技市場的分析 (圖片來源)。

盒鬚圖,或稱箱型圖,通常用來呈現資料在統計上分布的情況。其實算是一種直方圖或長條圖的變形,但相對來說更能快速看出這組資料的中位數、四分位數、以及扣除離群值之後的最大與最小值,例如下圖不同產品訂單數量的分佈情況 (圖片來源)。有時候也會與其他圖表結合使用,例如上面有提到過的股票走勢,就是結合了瀑布圖進行呈現。

總結

我覺得就像做產品沒有標準答案一樣,在進行資料視覺化時也沒有哪一種方式是最好的,只有最適合的。

所以,如果做產品需要先知道目標客群是誰、痛點和需求是什麼;那進行資料視覺化一樣也需要去思考:

  • 誰會需要看這張圖表
  • 他們需要得到什麼資訊
  • 這張圖表要說什麼樣的故事

都釐清了之後,就可以再來思考要說好這個故事的話,圖表的重點會是什麼。是單純想要呈現哪個資料的量最大嗎?還是也想要展示整體資料的分佈、或隨時間變動的分佈情況?或是還想要再進一步去比較這些資料的不同面向呢?

這其實也就回到這篇文章最開始,那張圖片正中間的問題「What would you like to show」。所以等上面幾個問題都確定了之後,要使用哪種圖表類型差不多也就呼之欲出了,最後就只剩下把圖表製作出來而已。

也唯有先確定好這些目標,才能夠選擇出最適合的資料視覺化方式與圖表類型,達到事倍功半的效果。也祝大家在資料視覺化的路上都能夠走得順利。

謝謝您看到最後!
若您喜歡我的文章,歡迎留下一些留言、按下「拍手」給我支持、或是「Follow」我,讓我提供更多文章給您。

--

--

Mike Pan
Mike Pan

Written by Mike Pan

偶爾兼差 UX, Researcher, Data Analyst 的科技業小 PM,喜歡觀察,並試著拆解生活中所看到的人事物

Responses (1)