接續上一篇的內容,下面要切入主題的重點了,也就是統計圖的種類與應用。下文中舉了許多例子來說明,由於這些知識都滿新鮮有趣,於是彙整了重點讓大家容易讀懂。

 

 

統計圖製作要項

 

長條圖

 

『長條圖:是以若干等寬平行長條之長短表示統計資料數量大小,用以表示屬性數列和空間數列,適用於一般指標如數值、增加率等各項目間沒有連續性之資料,依類型大致可區分為垂直型、水平型、上下對稱型、組合型、帶型圖、立體型等六種。』

 

    

 

 

 

『長條圖應用上之注意事項

1.繪製時應注意:(1)以零為基線,並以基線為出發點作圖。(2)最高之刻度線以能包含資料中最大數值者為限。(3)各條的排列次序,以資料數量大小順序排列,若為時間數列則依其先後次序排列。(4)各條之寬度及條與條間的距離須相等,條間距離通常以不大於條的寬度及不小於條寬的一半為最適原則。

2.破格線之使用:當各資料數量間差距微小,致圖形變化不明顯或資料中有一項或二項數量對其他數量相對特別大,致其他數量不能明顯看出其差異情形即可使用破格線。

3.與直方圖不同之處:長條圖中條與條間有空隙,而直方圖條間為無空隙,且使用之資料只有連續性。』

 

線形圖

 

『線形圖:是以曲線的起伏表示某種現象的分配或變動情形,適於具有時間性的指標,一般以橫軸表示時間,數值大小則表現在縱軸上。』

 

 

 

 

 

 

 

『應用上之注意事項:

1.指標值之座標過大或過小,致所表現的走勢過於平滑或激烈變化均不相宜(如圖3.163.17),因此設計時須訂適當座標,使圖示的變動感覺與分析者一致。 (如圖3.15)

2.破格線之使用:若數列有一或二項數量對其他數量相對特別大,致整幅圖的曲線波動不夠明顯時,皆可用破格線表達之。

3.數值標示在曲線上方

 

 

 

 

 

 

面積圖

 

『面積圖:以面積大小表示統計資料大小,通常為顯示各項目占總體的百分比,故所有面積百分比加總必為100,依類型大致可區分為圓形圖、扇形圖、帶狀圖、立體圖形等。

圓形圖:畫法以12 點鐘為基準,將統計資料所占比例以順時鐘方向及分類、時間或結構比大小的順序標示,並可以同心圓之內圓標明調查年月或全體總數。』

 

 

 

『扇形圖:顯示二個樣本構成比的差異,圖形具對比效果,分為上下對稱:資料顯示以水平線零度由左而右依序排列左右對稱:資料顯示以垂直線零度由上而下依序排列。』

 

 

 

『帶狀圖:以長方形全部面積為100%,由每部分面積所占大小來觀察指標變化,帶狀圖互相比較時,可加上連結線以突顯彼此結構之差異。』

 

 

 

 

『統計地圖:適於地理別資料之比對,並顯示地理位置關係,以顏色或密度之濃淡表示指標值之大小。』

 

 

仔細讀完這一段,你是否也開始對統計圖肅然起敬?統計圖的製作絕對是專業中的有專業,筆者邊讀邊努力回想國小 國中 老師是不是有教過...,答案是:一定沒有!其實國外有專門研究統計圖形的學門,研究主軸是如何把統計圖畫的清楚易懂。抽象的概念最難能可貴的就是可以具體呈現,如上面說明的那麼多種圖形,各自有適用情況,用錯了行不行?其實也無大礙,只是表達起來一定沒那麼適切,這就是統計圖的藝術之處。

 

統計圖須注意的六項準則

 

 

『統計圖表是一種將資料分類陳示、化繁為簡的工具,尤其是統計圖更是利用生動活潑的圖形及巧妙地構思繪製而成。統計圖要能達到必須性、準確性、有效性、一致性、清晰度及有意義的資料等六項要求:』

 

() 必須性:統計圖必須具備哪些要件呢?除了基本的資料來源、單位、時間等須註明外,座標軸刻度及原點的標準也須合理相同才行。』

 

 

 

 

『若想同時表達2個相類似項目的統計圖時,也須注意座標軸刻度。如下圖中的2個長條圖都是癌症死亡人數比率,其差別祇是男性與女性而已,但從長條圖的圖形高度會以為女性胃癌死亡比例比男性高,但實際資料卻是男性(8.69%)比女性(7.75%)高,原因是這2個長條圖的座標軸刻度標準不一致所造成。』

 

 

如下圖,第2項的「祭祖吃年夜飯」資料明明就比第3項還要大,但圖形卻是矮了一截,原來是輸在起跑點上了,也就是2邊的原點高度不同所造成。

 

 

() 準確性:統計圖的基本要件都注意備齊後,接下來就要看圖形畫的準不準了。所謂準確性是說圖形所代表的範圍比例須與數字變動比例一致,並儘量避免易造成視差之立體圖。

 

Tufte 教授在1983年曾提出說謊因子作為圖形確度的測量,教授認為正確的統計圖形應該是數字變化多少圖形就要反映多少,因此說謊因子應介於0.95 1.05 之間才對,所以說謊因子就等於圖形效應大小除以資料效應大小。而圖形效應是指統計圖中最大與最小項目的圖形大小比例;而資料效應是指這2個項目的資料大小比例。因此根據公式可知左圖的說謊因子為3.27,表示圖形的變化過度渲染了資料的變化。另外,相反的圖圖形的變化則是低估了資料的變化。說謊因子=圖形效應大小/資料效應大小)×1000.95≦說謊因子≦1.05。』

 

 

 

() 有效性:圖形雖然畫的準,但也要注意資料分類或圖形的使用是否恰當,並且資料也儘量依時間或大小來排序。』

 

() 一致性:要注意圖形維度不要超過資料維度,且圖形內容與本文或傳達之理念須一致。用二維圖陳示,重點在於以圖形面積的變化來代表資料的變化。

由下圖的資料發現不論哪一年的垃圾清運量,在高度和寬度都做等比例的變動,如65年的圖形面積約為80年的1/4,但資料實際上卻僅有1/2而已,因此該圖的訊息傳達扭曲了數字實際的變化趨勢,其說謊因子以電腦估算約為2.3,已超過1.05的警戒點。』

 

 

 

() 清晰度:統計圖圖形須明顯陳示重點,清楚易讀,且忌將設計的變動混淆至資料的變動。

下圖給人的感覺是不是以為那些針筒是主角呢?其實不是的,主角是他旁邊那些又瘦又高的「Model」,黃色是代表AIDS 病例數,而紅色是HIV感染者數,所以那幾支無意義的針筒必須變小些才行,不然就會造成喧賓奪主、多此一舉的反效果,而影響整體圖形的清晰度。』

 

 

 

 

 

 

() 有意義的資料:為使資料更具意義,有些資料必須先將其標準化或平減後所傳達的訊息才會較準確,不然就必須要選擇具有代表性的資料才行。

下圖的時間序列相當的長,因此在比較1970年至1989年的房租時,應該將物價的變動考慮進去,也就是以實質資料代替名目資料較為恰當。』

 

 

 

 

『結語』

介紹完這個比賽的一些細節,不知道大家有什麼看法?是覺得「好煩,畫統計圖好複雜好難」,還是「滿有趣的,我也想要試試看」?筆者個人是認為:多一些些規則的比賽其實比較有趣,比較耐人尋味,也比較有客觀的指標來評判優劣。如果與一般的比賽一樣給你一個主題自由發揮,相信辦個一、兩次也就無聊了,創造不出什麼新局面。期待這個比賽的發展許給未來的主人翁一顆理性的腦,把我們國家的藍圖規劃的更精準更美好。

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()