我會與違章工廠結緣,是因為從事數據工作多年,深覺得資料應該與民眾生活結合才有意義。因此在2019初,選擇這個當時正發展中的議題,作為起手式。切入的角度為資料視覺化(Data Visualization),材料為公開資料(Open Data),工具為Power BI Desktop

歷經約三個月的討論與實作,終於把一個作品完成(1)。老實說,我並不是很滿意,原因有資料不夠完整,也有創意不夠多,更有覺得美感能力不足之感。但無論如何,這是一個開始,過程中收獲良多。隨著工輔法6/27修正通過,這個議題似乎有點偃旗息鼓,不過我相信只要污染的事實存在,這件事隨時會再引起大家關注。

回到實作過程,有幾點心得可以和大家分享:

 

第一,資料的連結點

公開資料來自不同單位,當我們要把它們集結在一起時,一定要找到連結點。以主資料集(註2)來說,這是台灣環境資訊協會為在2018選舉時督促各侯選人重視,整理的各鄉鎮市區的違章工廠家數與面積。當我們想知道工廠與國人癌症的關係時,連結點是什麼?就是鄉鎮市區。所以我們找的癌症統計資料也要有地理註記,因此我們在衛生福利部統計專區,找到<十四、五大癌症死因相關疾病戶籍縣市鄉鎮別就診統計>這個子資料集,可讓我們以鄉鎮別為單位,來呈現工廠數多寡或面積大小,與癌症人數的關係。

同樣地,工廠與空品的關係、工廠與所得的關係,也是以地理註記為標準,在環境保護署環境資源資料庫、財攻部財政資料中心二個網頁,找到<空氣品質監測日值 (2017.1-12 一般測值)>、綜稅所得總額各縣市統計分析表1214>二個子資料集。因此我們可以順利進行資料集之間的整合。

 

 

1.jpg

 

第二,工具的預處理功能

開放資料的格式不一,並不是直接load進工具中即可使用。以上述癌症統計資料集來說,它雖只是一個excel檔,但有20張工作表,要把其中用得到的10張工作表匯總成一張就是一個大工程。政府統計表(如下圖)要變成資料表(data table)格式,這就有點費功夫,所幸PBI Desktop的編輯查詢功能強力,整理上非常方便。有興趣讀者可以youtube搜尋違章工廠應用Power BI實作1~4篇,可以看到製作過程。

工具必須有很強的資料預處理功能,這點很重要的,因為要把各門各派資料集,以統一格式集合在一起,絕對是資料科學中最花時間的一件事。打個比喻,如果你去買手搖飲料,剛好有五家在同一街上,你想比較後再買,即使你拿到了五張menu,馬上面臨到,1同樣東西名稱不一致,如珍珠、粉圓、波霸….2品名創意不同,如波霸烏龍奶茶,即烏龍茶加牛奶加珍珠,但白玉歐蕾,這是什麼東東!3標準不同,半糖、微糖、三分糖、少糖,每家都不一樣,可以統一用百分比嗎?

                   資料整合也是一樣,要把各資料集的名稱、定義、標準統一,要花不少功夫。如果你使用的工具不強,那你可能還沒登陸,就先死在沙灘上。Power BI編輯查詢(其實就是power query),提供了強大的資料欄列增減、分割、轉換、填補、轉置等功能,就好像有了兩棲登陸艦,幫你快速登陸建立灘頭堡。

 

2.jpg

 

3.jpg

 

第三,說故事能力

由於儀表板是由各種資料圖組成,它會讓人注目,但卻不一定能打動人心,引起共鳴。打個比喻,你乍看到畢卡索的畫,可能會有一種心靈的觸動,覺得有一種感動,但它在講什麼?作者到底在表現什麼意念?你還是需要看一下旁邊的小字卡,即使字卡上只有畫名也好,透過文字給你一些線索。

資料視覺化也一樣,需要一個藥引,一個導覽。在違章工廠開放資料大串連」視覺作品中,每一頁都有一個標題,就是貼標籤,給觀眾一個線索,好像破關密語一樣,讓觀眾心中有一個目標來探索這頁的奧密。

其次,我也把自己的洞見寫在旁邊,讓觀眾操作圖形的籂選器,來驗證我的觀察對不對。這就好像在看考古題時,答案擺在旁邊,看完題目後馬上對照答案。雖然這樣看似減少了觀眾的投入,但就像小孩聽老師講孫悟空故事,自己會想去借書來看,收獲是不一樣的。所以,在圖旁的結論文字,就好像先給小孩講個故事一樣,目的在引起小孩的興趣。

                 最後,我再利用超連結功能,外連到我事先錄好的影片,加強說故事效果。這種畫龍點睛的方式,更能吸引一些純觀看型的民眾,快速的解讀資料過程,節省了大家不少時間。(youtube搜尋違章工廠PowerBI報表介紹一~四」)

 

4.jpg

 

雖然儀表板畫面,美工程度有待加強;youtube錄的影片效果也不是很專業。但透過這次實作經驗,了解到違章工廠佔用農地的嚴重,升起了對土地的關懷心;鍛鍊Power BI Desktop的運用技術,升級了對資料視覺化的信心,可說是一舉多得!!希望這次實作,也能喚起大家對身邊環境的關心與行動。

 

1違章工廠開放資料大串連作品

https://app.powerbi.com/view?r=eyJrIjoiODMyNmNhYmYtYWZmMC00NGEwLWIzOTEtOTFiZjkyZWQwZGM5IiwidCI6ImM5NDQ1ODJkLWUxMzAtNDJkMC1iNTQ2LWFhYjEyOTkyODAxZCIsImMiOjEwfQ%3D%3D

2:主資料集<主@2018違章工廠縣市利害相關人盤點_現任縣市長議員鄉鎮長代表立委農會>

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()