如果數據會說話,那應該多聽聽不同數據說的話
上個週末參加了 Re-lab 主辦的 台灣發生什麼數:人人都能看懂的台灣數據展、以及座談會之後,算是對於數據有了很不一樣的認知,而且產生了蠻多的反思。
以下就來跟大家分享一下我滿滿的收穫吧。
首先是展覽的部分
逛完一輪之後真的覺得,不愧是專門做資訊設計的設計公司,在每個展區的設計都是別具巧思,讓大家用不同的方式去感受數據。
例如一進入到展場,就看到許多代表台灣這幾年來大家所搜尋、所在意的是什麼樣的關鍵字的氣球,先讓大家感覺一下這部分跟自身的體感有沒有差異,會不會自己的同溫層只在意特定議題。
而在專家訪談的展區,影片中其實蠻多人都有提到在看到一份數據時,都要試著自己去思考這份資料是什麼單位製作的、想要解釋什麼現象、以及數據的組成方式 (例如一張生育率走勢的圖表,那裡面生育率的分子和分母分別是什麼)。
其他還有像是精選出來的 100 個議題的圖表,但不帶任何的詮釋,讓大家去思考這些圖表背後可能的意義。
重頭戲我覺得是座談的部分
總之講者一開始就給了大家幾張圖表,然後問現場的大家,這樣的數據給你什麼樣的感覺。當然大家就會各自表述,例如生育率下降的圖表,有些人覺得這會造成國家競爭力下降、有些人則覺得能夠降低環境的負擔不錯,畢竟目前就是人口過剩的狀態。 (這邊其實還蠻難用文字呈現那種討論的踴躍程度XD)
去思考數據想傳達的是什麼資訊
而上面的過程其實也就代表了,當今天只是單純圖表、不帶有任何註解的時候,詮釋的方式就可以有非常多種。
所以當看到一份數據、圖表上呈現某種走勢的時候,是不是就代表真的是這樣呢?還是其實這只是特定維度所呈現出來的資訊,為了達到資訊提供者想傳達出來的結論,但實際上可能有其他的解讀方式呢?
去了解統計的是什麼數據
例如從政府得到的火災發生件數,會看到某個時間點開始爆增 (如下圖),但其實就只是因為原本只統計有死傷的火災、後來改成有財物損失的也列入。所以其實是標的改變,才造成數據產生變動。
另外還有像酒駕肇事死亡人數也有分成 24小時內死亡人數、以及30天內死亡人數,在比較數據時也要注意。還有比較常見的則是,這份資訊呈現出來的是絕對數量的變化、還是相對比例的變動,兩者的走勢也不一定會相同。
不過就算絕對數量、相對比例都呈現一樣的走勢,例如某種疾病的患者、或是家暴受虐的情況上升,其實也並不一定就代表了情況惡化。因為很有可能這類的數據有辦法統計到的只有通報的案例,所以代表的其實是大家越來越有意識要去做疾病的篩檢、或是受虐時不會自己隱忍下來。這其實是好的現象。
去探討數據的組成是什麼
舉例來說的話,其實就是前面提到的分子與分母的概念。例如生育率的分子,因該都能猜到是新生兒數量;但分母,可能大家都沒有好好思考過到底是什麼,例如下圖,其實可能有很多選項。
而最常用來計算的其實是選項 C「15~49歲的女性人口數」,就意義上來說其實就是有生育能力的人口數。所以製作出來的圖表當然就會看到生育率節節下滑 (如下圖)。
但如果換另一個選項,把選項 D「有結婚的女性人口數」當成分母,則會看到在 1985 之後的生育率反而是上升的 (如下圖)。代表著如果同樣都是拿有結婚的女性來做比較,那生育率反而是上升的!
所以,有結婚的女性生育率是上升的,那是結婚的人變少了嗎?
接著再來查證一下結婚率,也就是結婚對數除以總人口數,會看到從 1980 以後的確是呈現下滑的趨勢。
所以,與其說「大家都越來越不生小孩」,倒不如用「大家都越來越不結婚、所以小孩也越來越少」來描述,會更精準一些。
總結
我覺得對我來說,最大的收穫就是不能被眼前看似精美的圖表所蒙蔽了,這一切可能都是精心設計過的。
當然這不一定完全是假資料,很多情況下資料是真實、沒有造假的,但選擇的解讀方式不同,當然也就會產生不一樣的資訊,進而傳達給讀者不同的感受。
所以在這個資訊爆炸的時代,我覺得最需要的大概就是批判思考的能力吧。也就是在了解眼前的是什麼樣的數據、想傳達什麼訊息之後,還能夠去思考有沒有可能用其他的角度來解讀。
也唯有這樣,才能夠進一步去找到不同面向的數據,真正去傾聽不同數據告訴你的不同故事;而不是只聽信某個角度的數據所說的片面之詞,就做出結論。
謝謝您看到最後!
若您喜歡我的文章,歡迎留下一些留言、按下「拍手」給我支持、或是「Follow」我,讓我提供更多文章給您。