【摘要】有人戲稱統計是混水摸魚術,在混濁的水中想捉到魚並非只靠運氣,而是必須具備某種訣竅……

在經驗科學裡,觀察和實驗是求知最重要的初步工作。觀察和實驗的紀錄通常是一大堆原始資料或數據,如何從這大量的資料中尋求其潛藏的意義,統計學是不可或缺的分析利器。有人戲稱統計是「混水摸魚術」,在混濁的水中想捉到魚並非純然靠運氣,而是必須具備某種訣竅。依據這種訣竅,在混水中能對魚的所在「洞若觀火」,一清二楚,自然手到擒來。對一大堆數據來說,統計方法正是顯示意義的訣竅。現代統計學大致分成「記述」統計和「推測」統計兩大類,前者如上面所述為分析及解釋資料的意義;後者為依據樣本結果推測群體的狀況。

統計學的應用範圍

通常我們研究一個問題,由於受到財力、人力、時間等資源的限制,無法取得太多的數據。因此只好觀測樣本。由樣本結果推論群體的過程中,存在一種不確定性,也就是一種無法以人力控制的得況。既然推測過程中的不確定性無法避免,則統計學必須有處理不確定性的方法,否則無法進行統計推論。概略地說其方法有二:一、測量不確定的程度:其目的在於據以說明推論結果的可信任度,這就是現代統計學必須以機率論為基礎的原因所在。二、減少不確定的程度,所採用的方法很多,例如在民意調查中使用「抽樣設計」或實驗工作中的「實驗設計」;其目的在於控制未知因素的影響,增加推論結果的可靠度,以便有效利用我們所有的資源,使所得數據具有代表性。

統計學應用的範圍十分廣泛,例如政府所舉辦的勞動力調查、工商業普查,或民間企業界的市場調查等,在農業方面使用實驗設計以改良品種,增加生產更是眾所周知的統計應用;另外品質管制也是工業界使用統計方法的實例。順便一提的是統計學在社會科學方面,如心理學、經濟學方面都有重要應用。在大學聯考的選組方面,一般人以為如果自己數學不好,不適宜考理工組,而改考社會組,事實上社會組的學科也已越來越數量化,數學不學好,將來在大學選修課程,尤其如果想從事研究工作,實在相當不利。

在科學研究中,通常在得到數據後,經過整理,化繁為簡之後,其特性已略見一般。然後研究者可再進一步依其研究目的,採用適當的統計方法如估計、檢定或相關或迴歸分析,以了解樣本所隱含的重要性質、變數間相互關係及變動的趨向等,求其結論。統計學主要是對未知提供指南(a guide to the unknown),但是常見許多人使用統計如同醉漢利用燈柱,主要是用來支撐而非照明,這是非常可惜的事。

統計學的概念在日常生活中隨處可用。舉例來說,賈博士由於科學研究工作的需要,經常必須搬家。他發現適於他居住的房子租金的變化隨著區域不同而有很大的不同,即使在同一區域內,租金也各有差異。他和太太商談後得出一個找新家的策略:首先找一個暫時落腳之處,然後分頭到招租的房子去看和詢問價格,以便得出一個「參考分布」。建立這個價格分布之後,有助於決定自己中意的房子租金適宜、偏高或便宜。這種建立價格分布的做法,就是統計概念的應用。

統計數據的描述常用的方法不外圖示法及計算法。圖示法的優點是易於使用,同時也容易為人所了解。圖示法的使用由來已久。例如1786年普萊費(W.Playfair)所著Commercial and Political Atlas一書中,不但含有許多經濟數據,同時也是最早使用條形圖(barchart)的書。本文擬敘述兩個史實以說明圖示法。

毛端的故事

將數據化為資訊:這個故事發生於十九世紀中葉。有一個名叫毛端(M. Maury)的年輕美國海軍中尉,在他腿傷漸癒時,十分冒昧大膽地向上級提出海軍必須改革的數項建議,其中一項是令半數海軍上將退休領半薪。毛端並非令每個長官所喜的年輕軍官,因此在1842年當他完全康復之後,海軍總部派他擔任一個海軍中最糟的職位,量測長(chief of metrology)。

毛端上任之後,發現自己也是航海日誌(logbook)的保管員。辦公室內到處堆積著美國海軍船艦歷次出航的完整航海日誌,內容包括海浪的方向及速度、水深及水溫,還有風力和方向。毛端對於航海深感興趣,但也為美國船長的缺少輔助工具而大表不安。在他給戰事局(War Office)的一封信中,毛端指出即使航行於乞沙比克灣(Chesapeake Bay,一個大西洋的海灣,臨近美國維吉尼亞州及馬里蘭州,長達二百英哩)時,美國船艦仍然必須仰賴英國海軍所遺留的航海圖。

毛端因此盡力整理編輯他所看管的數以千計的資料。目標是:「將航海者所累積經驗都系統化,以便往後任何航海人只要一看這些資料,就能擁有前人的經驗。」經過不斷的研究他終於發展出一套簡單的圖形。他將風向以箭頭表示順風,並以箭頭的長短與風力成比例;對於浪速,他繪以手指指出水流方向,並在手指之下以數值表示。水溫也繪出(plot)並且畫上底線。

有一個名叫傑克的船長是最早使用毛端所製圖形從事航海的人之一,他指揮一條WHDC Wright號的帆船由美國巴爾的摩到巴西里約熱內盧。毛端的航海圖顯示,傳統的偏東航行以避免在聖羅喀角(CapeSan Roque)沈沒的作法,是沒有必要的。因為在該地的風浪並不危險,反而相當平靜。 Wright號抵達里約的時間是38天,比已往的紀錄快了17天。另外有一艘名叫做飛雲號(Flying Cloud)的船依據毛端的航海圖,在1851年六月二日繞道Cape Horn,從事由紐約至舊金山的處女航。她只費了89天就抵達舊金山,只差21小時就比已往紀錄提早一個月到達。在她返航回紐約時,又打破了剛創的新紀錄。利用毛端的航海圖,飛雲號在六個月內就為她的投資人賺回全部購船費用九萬美元。

海軍船艦在環繞世界的航行天數也因使用毛端航海圖而省下三分之一的時間。毛端的航海圖使得每位船長擁有先前航海者所有的知識,同時每位船長也可利用這些知識改進他的船隻的績效。

1853年,由於毛端的倡導,第一屆國際海洋量測會議在比利時的布魯塞爾舉行。參加的十國一致無異議地同意,分享使用毛端所修訂摘要航海日誌(revised abstract log)的資訊。毛端也承諾凡是提供給他航海日誌的船長將獲贈一本新版的航海圖。在其後的五十年間,十國提出百萬冊的完整摘要航海日誌。毛端幾乎獨力將航海帶入現代,將原先每位船長必須依賴傳統式猜測與經驗的作法改為科學觀測。

南丁格爾的故事

將數據化為行動:以下的史實是英國南丁格爾((F. Nightingale)的故事。在克里米亞戰爭期間(1854~1856年),南丁格爾應戰事部長赫伯特(S.Herbert)的要求,組織、訓練並帶領一隊有38位護士的隊伍到克里米亞的野戰醫院服務。當她到達現場,她被野戰醫院惡劣的條件嚇壞了。「院內的病床都受到蝨子和老鼠的傳染。建築的地下就是排水溝,……累積著污垢……當風吹動時,溝中臭氣由管路飄上地面……那正是病人躺在草蓆上的所在。」

她對戰地醫院的批評並沒有多大分量,因為她只不過是一個護士,一個女人。她立即動手開始蒐集醫院內傷亡的數字,但是她所遭受的困難不僅是如何將這些數據化為資訊,更困難的挑戰是如何創出新的表示方法,將這些整理所得結果以引人注目的方式表現出來,以促使有關當局採取行動,改善野戰醫院的惡劣現狀。

南丁格爾對比利時天文統計學家奎萊特(L.-A.-J. Quetelet)衷心崇拜。據說,她在早年即已有偏好蒐集數據和分析數據的傾向。當她由克里米亞返回英國後,遇到使用圖示法的先驅人物法爾(W.Farr)。南丁格爾將法爾的條形圖(barplot)發揮得淋漓盡致,同時發明了我們現在稱為極坐標圖(polar chart),戲劇性地表達出她的觀點。由圖一中,我們可很快看出在1854~1855年間死於感染性疾病、其他原因及受傷的惡化狀況。到了1855年一月,由於感染性疾病而死的死亡率使得陸軍不得不隨時調遣新兵補充。僅因感染性疾病而死的人數,幾乎是其他原因及受傷死亡人數的兩倍。

南丁格爾所得資料數據化地顯現如圖二所示。她將1855年於史庫塔瑞(Scutari)的士兵死亡人數以週為單位表示出來。由圖可知在1855年六月因感染死亡人數,約僅為二月份的1/9。事實上,克里米亞戰爭末期,在克里米亞的士兵死亡率比駐於英國本土的士兵的死亡率還低。

南丁格爾返國之後,立即對英國國內駐軍的問題展開攻擊。圖三是同年齡群國內駐軍與平民男子死亡人數的比較。圖四是她將15~45歲士兵與平民男子死亡率以不同疾病區分的比較。結果顯示因感染性疾病而死的士兵的死亡率,約為同年齡平民男子的20多倍。她的研究結果由第三者向剛成立的醫事委員會發表(因她是女性,依當時習俗不得出席於委員會之前)。這時亞伯特親王和維多利亞女王對這項發現甚為注意,因此陸軍醫藥服務局被迫說明事實真象,大幅改革於是開始。

由第一個故事可知,美國海軍的歷次出航的航海日誌,雖然含有豐富內涵及實用價值,如果毛端沒有使用統計方法加以整理歸納,成為有用資訊,現代航海的進步可能因此遲緩若干年。另外,南丁格爾如果未能用統計圖表將克里米亞戰爭中,英軍因感染性疾病而死的真象以數據化方式展現出來,就不可能引起有力人士的注意,軍醫改革也可能不會發生。從這兩個史實讀者應能體認到統計圖示法的應用及威力。

統計方法是一個講求事實顯現真象的實用手法,它並非僅限於科學研究之用,日常生活中所遭遇的問題同樣也可用統計方法蒐集數據、分析結果、尋求對策及確定效果。至於如何活用,則「運用之妙,存乎一心」,戲法人人會變,各有巧妙不同,大概就是這個意思吧。               ~轉載自網路文章

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()