當大家已經初步會製作視覺化統計地圖後,接下來舉一些與台灣相關的實際應用範例。
首先,主計處有建一個縣市重要統計指標查詢系統的網站,可設條件查詢各縣市的資料(http://ebas1.ebas.gov.tw/pxweb/Dialog/statfile9.asp)。下載後大概會像下表的樣子:這是其中一項指標
當大家已經初步會製作視覺化統計地圖後,接下來舉一些與台灣相關的實際應用範例。
首先,主計處有建一個縣市重要統計指標查詢系統的網站,可設條件查詢各縣市的資料(http://ebas1.ebas.gov.tw/pxweb/Dialog/statfile9.asp)。下載後大概會像下表的樣子:這是其中一項指標
一般在做資料鍵檔案,某一位受訪的對象都會輸入在同一列,如下圖,只要是從這位受訪受訪者搜集來的資料,無論是對某一件事測量很多次(如國文與數學各測3次),調查受訪者家中訊息(如父親年齡及同住人數),都會keyin在同一列。之所以會這樣鍵檔,除了輸入方便之外,另一個原因是幾乎大部分的分析都需要這種的資料格式才有辦法執行,而這種資料格式我們稱之為短資料(short form data)。
本周六10/5就是S3賽季的世界大賽囉,在此之前我趕緊再發一篇LOL的小研究讓有興趣的人參考參考,這次研究的主題很簡單,就是:當兩隊經濟差距到多少的時候,比賽就定勝負了呢?有玩LOL的人都知道,經濟就是一切,如果經濟被對方拉開,就算你手速超快放招如神也救不回來。但是問題是當比賽開始幾分鐘,而經濟差距多少勝負就底定了呢?我這次一樣收集了夏季聯賽70場比賽,每場比賽雙方隊伍在10、15、20分鐘時的經濟差距以及最後的輸贏結果來分析,我希望能找出一個好的預測點來幫助預先判斷比賽的勝負。
GeoDa的Workbook最後版本是2006/3,其後官網上就沒再看到更新,所以內容有些是以舊版的GeoDa來撰寫,但不妨礙學習,所需data也放在官網中(註1)。要注意的是,由於這是美國人寫的軟體,檔案路徑不能有中文,故不要把程式和資料檔放在桌面上。建議大家在D槽下開一個英文目錄(如D:\GeoDawork),全部放入,這樣讀檔才不會有問題。
這本手冊共分25節,前6節在練基本功,學習開檔、讀檔、資料結構、經緯度連結等,第7~12節為探索性的統計圖表呈現,第13~21節則是地圖映射、空間落遲、空間加權、空間自我相關等特殊概念,第22~25節則是從傳統迴歸延伸到空間落遲模型、空間誤差模型。
我是英雄聯盟長期的忠實玩家,這個遊戲是五打五的推塔遊戲,需要彼此高度的默契配合,並且由於遊戲中有100多個角色,各有不同的技能組合,所以非常耐玩,可以和好朋友們度過許多愉快的假日與夜晚(對遊戲不熟的人可以先看一下這個影片的簡單介紹https://www.youtube.com/watch?v=gIuU75aPTus)。
筆者過去曾經以「地圖空間的敘述統計」為題,發表了二篇文章,文中係以ArcGIS軟體來示範。其實,以入門者來講,這套商業軟體太龐大太貴,即使試用版也嫌安裝複雜又難學。所幸,在GIS研究領域,還有許多免費且簡易的軟體可用,且對大多數研究者綽綽有餘。這其中首推美國國科會1998 年贊助成立的「空間社會科學整合研究中心」(Center for Spatially integrated Social Sciences, CSISS),所研發推廣的免費軟體Geoda。
該軟體最早的測試版本GeoDa™ 0.9.5-i是在2003年2月發布,它是由ESRI公司(即ArcGIS的開發者)旗下產品延伸而來。2005年為了開放來源碼及在linux、Mac等平台上使用,發布了OpenGeoda版本。經過了一段時間,Geoda終於在2011/10/10發布1.0正式版,至2013/3已發布至1.4版,且可跨多個平台,全球已成立超過9萬個社群(註1)。依據2005年簡報,台灣是使用人數排名第八的國家,了不起哦!!
一直以來,大家對於關聯規則分析(Association)的入門介紹,都僅止於尿布與啤酒一起購買的例子,但實際情況是,老闆對客戶下次買什麼,可能更有興趣。因為普通關聯規則是建基於客戶已經上門,再送上最常見的商品組合,加速成交;但如果客戶根本還沒來,把尿布與啤酒綁在一起,有什麼用呢?
(11)為了讓Q為正值,建議將等級平均數叫大的那組擺前面,並算出兩兩事後比較的Q值
(12)開始查表,由於本例子的組別數為三組,因此並需看K=3那一列,如果算出來的Q值有大於2.394,則代表差值已達.05的顯著水準,若Q還有超過2.936,則代表差值已達.01的顯著水準。因此以本例所算出來的結果,得知第3組「教師兼行政」的教師素養顯著高於第1組「專任教師」與第2組「教師兼導師」,而「專任教師」與「教師兼導師」的教師素養則無明顯地差異存在。