統計的出世及入世觀
謝邦昌(輔仁大學統計系 教授)
裝飾了這麼漂亮的題目,可能只是這一、二年來自己心中的牢騷,或許也可將之視為統計人的心靈改革。促成此題目最大的動機是希望能提振統計的風氣,因為無論是院處、省府或縣市,有許多同仁私下與我聊天時皆認為現下統計的氣氛日益低迷,甚至在學校也經常面臨學生的質疑,他們懷疑統計的價值,對統計在社會中扮演的角色與發揮的功能無法產生認同感。相信一些和我一樣從事統計研究的先進在看待這些問題時也有相同的看法,希望能夠有認同我們的人並且在這共識間共同持續地努力。
任何領域最重要的就是每一個參與的人對此領域的關心,我經常講一句很臭屁的話:「when you analyze any topic, you are involved in statistics.」,自從在很多場合發表過這句話後,至少還沒有人認為我在”澎風”。事實上亦是如此,在許多領域中會發覺需要統計,統計在許多領域中皆扮演舉足輕重的角色。當然並非沒有統計就無法運作,但有了統計加入,可以做出更好、更精緻的決策。因此統計是無所不在的。我本身所學為生物統計,當初一進農學院,老師就告訴我們一句話:「when you eat, you are involved in agriculture.」,你只要想到吃,你就在所有農業範圍裡。相對的,只要想到任何領域中的任何分析、任何主題,就應該involved到統計的領域裡面。因此今天並非統計沒落,而是因為大家都懂統計,很多人都認為他會統計,這時統計的專業人員應抱持什麼態度呢?絕不是人人都懂統計,就覺得統計不重要,相反的應該更重視統計,認定統計日益重要。這是我最初步的觀點。
在此引用韋主計長的一些論點,主計長曾有一篇「從管子問篇論整個國政」,他所寫的社會指標第一章的指標管理就提到從古到今統計對國政的重要性,漢、唐之興盛奠基於秦、隋兩朝代健全的統計制度,若沒有秦跟隋健全的統計制度,漢唐盛世無法延續如此之久,所以基本上從歷史的角度來看統計的重要是有其道理的。另外先提一下統計的本質—機率性,好比我想去一個地方,不巧碰上塞車,在路上我心理就會想有哪些替換道路,一個簡單的統計觀念在我腦中形成,也許我會將路線圖量化,然後去選擇可能最快的路。像這樣簡單的思考過程其實就是統計的應用。有句話蠻有道理的,「衛青不敗由天幸,李廣無功緣數奇」,歷代有人成功也有人失敗,其實不必喟嘆些什麼,只因為大家都活在統計裡,面對的是一連串的機率過程。是否統計便無法精確呢?其實就像我常說的,除了完全錯誤外,大概接近對就行了,所以會有什麼有趣的理論(funny theory),大概對就好了。但是並非要每個人去當差不多先生,而是因為統計所追求的並不是完全的精確,而是尋求一個合理的精確範圍,這是統計很符合人性的特質,學統計的人都知道這個道理,主計長亦是抱持這個觀點。
管子曾說:「不明於數欲舉大事,如舟之無楫而欲行於大海也。」意思是說在不清楚相關數據的情況下想做大事,無疑是沒有槳的船想航行於汪洋大海中一樣。例如政府想撲殺野狗,如果沒有野狗分布的數據,不知道野狗形成的來龍去脈,怎麼去執行?如何能下決策?再比方先前口蹄疫事件,原先說是一千億,後來又說是二千億,最後到四千億!什麼數據都出籠,類似這種情形,便可明白統計的重要。現在有另一種聲音,認為統計與資訊差不多,統計可以停掉了,併到資訊裡就行了。併併看吧!併在一起就更知道統計的重要了。實際上資訊能處理的還是有限,現在各院處都在推動統計資料庫,或首長資訊系統,這些東西都著眼於統計與資訊的結合,而非將統計併入資訊。統計在這個時代所扮演的角色應該是與資訊相結合,根據主計長的看法是統計方法的工具觀,因為統計是一個很重要的工具,它可以發現問題所在,相當符合現在的類神經網路的觀念,透過反覆學習與反覆的除錯,馬上再更正除錯所遇到的問題,進而以簡馭繁,顯示出一個大概的趨勢。我們經常在求線性模式,雖然很多現象並非線性,但是線性的概念可以馬上顯示出大概的趨勢,知道趨勢後,能掌握住這個趨勢就不錯了,不一定非得掌握住每一個脈動,這就是統計以簡馭繁的功能,然後再求新求變,研究下一步的方向,主計長便是把這種統計觀念放在他處理預算的工作上。
現在統計人常感覺士氣很低落,認為統計會被併掉,很多單位要裁就先裁統計人員;在學校學生學統計常覺得沒有什麼出路,不知道畢業後能做什麼?主計長很喜歡「戰火浮生錄」中的一段話,希望我們能等到他創一個統計的新局面,無論是國家統計局或其他統計方面找出一個較精確的出路,如果看過戰火浮生錄就知道,其實這段話蠻美的也蠻適切的,將這段話--
『如果妳等我,我一定會回來!但妳要認真的等,全心全意的等!等到天下黃雨,等到天飄白雪!等到妳心意動搖,記憶空白。等到所有的等待,都已靜止…..,我一定會回來!』
再配合美麗的背景,是相當美的境界。你會很甘心的等,等主計長創造歷史,也就是我們必須先回過頭來面對現實,這就是我想說的「統計的出世及入世觀」。
首先可以確定的是大家都認為統計很重要,這不是我說的,很多人都這麼認為,很多人需要統計,無論在學校、機關或業界,無論是縣市或各廳處,只要有需要我幫忙的,我一定非常樂意幫忙,因為這是我最大的資源,什麼資源呢?我能幫忙就代表我能發現問題、解決問題,從這個角度去看就可以知道很多人都需要統計,無論是工業統計、計量經濟、調查管理或生物統計各個領域都認為統計很重要,反而現在只有統計人認為統計不重要。現在健保實施了,生物統計想在衛生署的藥檢局裡積極推動一件事,因為現在任何藥的檢定是「可」經過統計檢定,我們希望把這個「可」改成「得」,任何新藥必須先經過統計檢定才可以上市,任何人體實驗必須經由統計檢定才可以通過。美國的NHI就是這麼做,所以一方面在國家衛生研究院(NHRI),一方面在衛生署,我們會積極去推動這個觀點,如此一來,無論是生物統計或是醫藥、農藥等各方面都需要統計,更不用說品種試驗還是計量經濟了。既然每個領域都認為統計重要,統計人該如何去看自己的角色與定位呢?相信很多研究統計的學者常感疑惑甚至產生混淆,比方說有一次中國統計學報與中國統計通訊表明只能送會員一本,結果大部分會員都要選中國統計通訊,經過我詢問的結果,原來大家覺得中國統計通訊才看的懂,怕看不懂中國統計學報。其實這是一個蠻大的問題,並不是我們要否定學術,假如你看過由美國統計學會出版的一本很有名的管理雜誌--JASA,它在世界上統計類雜誌的排名應該有前五名,若除開原文的因素,在後段至少有三分之一的文章是容易看得懂的,因為後面有很多是屬於CASE STUDY,沒有太多數學公式,他告訴你怎麼分析奧運選手的紀錄,告訴你怎麼分析一些工業污染指數的技術,這些東西有沒有學問?學問可大了!但在國內我們反而常會認為沒有公式就沒有學問,就像我為學生口試論文時,學生給了我一堆公式,結論卻只有一點點,問他那些公式是什麼?學生說不寫一些公式好像會讓人覺得沒有學問,這就是一個盲點。任何產業、領域都有其上中下游,統計也一樣,基本上會先有一個理論或方法論,再來才是資料分析,在上中下游互相循環推動下,產生領域的專業性,但是我們常把統計陷入數學的泥沼裡,以為統計就是數學堆砌出來的,因此發生疑惑,數學當然是統計的基礎,它絕對有其重要性,就像物理電子對資訊產業的重要性一樣,但是資訊業以及各項軟硬體設施之發展方向卻又比電子領域更廣,同樣的道理,統計雖可視為由數學所發展出的旁支,但是統計在應用科學上更加發揮了可長可久的境界,此時統計在各個領域中扮演著越來越重要的配角,也就是前面提過的理論方法與資料分析間的關係。很多人常認為資料分析不重要,學問不大,其實真正的學問就在此,如何將資料整合?如何定義資料?如何轉換資料?以何種方法處理資料?類似這種情形,並非單靠純粹的理論就可以解決,所以統計在各領域中也就益加顯出其重要性了。舉個例子來看,瑞輝大藥廠裡光是一個research center就有一百多個統計人員,差不多是我們主計處的三四局,由此可見其重視統計的程度,一個藥廠已是如此,更不用說是NHI或是國家衛生研究院了。
我自己做過一個簡單的調查,市面上出版的統計中文書至少有一半甚至三分之二以上都不是學統計出身的人寫的,在這裡我沒有批評的意思,好比大家在準備高普考,手邊經常拿著 顏月珠 教授的統計學, 顏 教授本身並不是統計出身,但是卻寫了很多統計學的書。問題出在哪裡?非本門科系的人都懂統計,他們學了很多東西後發覺統計很重要,所以回頭來寫統計的書,最近台大商學院也出了兩本統計,類似四人幫寫的經濟學一樣,寫的相當不錯。由此可以看出別人都很重視統計,尤其經濟學中的計量經濟更是重視,他們或許正暗自竊笑,你們統計人好像都不重視統計,剛好讓我可以涉足進來分一杯羹。而統計人卻又常把統計寫的太像數學,使人覺得統計不是那麼平易近人。另外,環顧現在研究所碩博士補習班教統 計的 老師,大部分都不是學統計出身的,而是學經濟、企管等相關科系的,他們學統計、考統計是一把罩,長此以往,若是統計人再不振作,那別人最高興了,他們學本行一把罩,統計方面又是一把罩,由大約百分之六七十的研究所都考統計這點可看出統計對其他領域的重要性,他們希望把統計的觀念與技巧都學過去。這時統計人應該更有信心,在學習上、在專業領域裡更加努力,我想強調一點,作為一個統計人的正確觀念應該是—把人家的本事學過來。
我現在主要從事民意調查的工作,而民意調查的核心實際上就是統計中的抽樣。所以要是統計這部分做不好,其他無論再加上什麼社會學、政治學都沒有用,但是換個角度想,除了把統計做好外,更要去學政治學、社會學這些相關學問來解釋統計的結果。學習別人的專業並非全部都要學,而是挑重點學,因此在學校裡我經常鼓勵學生修習第二專長,最好去修輔系,哪怕是文學院或音樂系都好,別以為沒有用,輔大音樂系主任就經常找我,他常常在分析不同時代或不同音樂家的音樂特性,因為音樂是可以量化的,而統計當然可以解決量化過的資料;另外在文學院,無論台灣或大陸學者都在研判紅樓夢到底是不是曹雪芹寫的,有些人認為是它的自傳,有些人認為後半不是出於其手,他們利用統計中多變量分析的主成分分析法來研究,怎麼做呢?以書中出現「之、乎、者、也」的頻率經過量化後去分析;清大 江永進 教授研究母語時經常到菜市場蒐集每個人講話的音頻以及詞彙運用的頻率,希望藉由統計分析後能編出一部台語的辭典。文學院和音樂系利用統計的情形尚且如此,更不必說其他科系了!所以我希望統計人能培養第二專長,以統計為核心再去學別人專業的部分,如此才會有更廣闊的發揮空間。
我本身並非社會學者,更不是政治學者,但是在民意調查的工作當中,我會很虛心的去學習他們的專長,以便做出正確的判斷。例如總統大選的時候,統計報表出來後,我會觀察 瞿海源 教授他們怎麼去分析,有哪些觀點,另外我會去看一些政治或社會學方面的書,慢慢的我可以明白專家怎麼去看統計數字,因為從社會學或政治學的角度去看統計數字和我們一般看數字的角度是不一樣的,因而此時身為統計人一定要有一種心理建設,要去把別人的東西給學過來,而不是只在統計領域中鑽營而已。很多人跟我說現在的統計分析太容易也太簡單了,把資料丟進MINITAB、SAS、SPSS,結果就出來了,我常笑著說這叫做「GARBAGE IN, GARBAGE OUT」,把一份不明緣由的資料扔進統計軟體,跑出來的分析結果還是不明究理,垃圾進去垃圾出來,一蹋糊塗也一片朦朧,唯有統計專業人員才比較懂得如何去分析,懂得如何善待與利用資料,因此身為統計人一定先要有統計方面的專業素養與技術,在此想強調的是統計有用論,至於如何使其有用?這就是我的主題—統計的出世與入世觀。
我經常用算命來解釋統計有用論,常在報章雜誌上出現的命相大 師文昌 居士曾說過一句話,「算命就是另類統計學」,沒錯,統計學裡的empirical rule、bayesian prior information、posterior probability等等,都很符合算命的精神,而算命的過程當中,無論是紫微命盤或是排八字等方法,其實也都是機率和排列組合的問題,至於看手相則可視為一種經驗累積,而經驗的累積正是統計學簡單的基礎。所以我常說學統計的人很適合去算命,也常和學生開玩笑說大概四、五十歲後要去開命理館,因為這也算是家學淵源,外祖父遠從清朝便在泉州學算命,後來成為算命師後,我常在一旁幫他溫酒,舅舅現正在南部鳳山幫人看相,有時候會開玩笑地跟舅舅說,反正算命又算不死人,你這樣算到底準不準啊?他說準不準在個人,信不信也在個人。實際上這一整個過程對我來說都蠻清楚的,假如學統計的人可以將之理論化、科學化,絕對可以做的更好的,因為算命的基本背景就是統計資料,任何算命師的觀點都是一種統計資料,好比現在省府經常在推動的統計資料庫或是首長資訊系統,將來就是一個很重要的首長算命系統,賴以決定用人的準則。所以統計對各領域的需求而言都是相當重要的。
從前常把統計形容成笑傲江湖小說中任我行的吸星大法,現在覺得太邪氣了,應該用天龍八部中的北冥神功來比喻,基本上都是一種吸納整理的觀念,因為統計可以將龐雜無章的數據經由整理分析後成為有用的資訊,這是統計最powerful的功能。現在大家學統計、用統計,必須抱持一個觀念,「統計就是生活、統計就是人生」,你投入的工作就是你的生活,你投入的工作就是你的人生,在研究統計當中培養工作和人生之間緊密的結合,你會發現這是相當有趣的。另外我們來看看統計的時代意義,1992年世界上最好的雜誌Science有一篇報導「Statistic data analysis in the computer age」,現今電腦的普及率節節高升,很多人認為電腦發達後統計就沒有價值了,其實正好相反,電腦愈是普及、愈是發達,就愈能帶動統計發展,提昇統計運作的效能,從前跑一個迴歸分析就得花好久的時間,現在只是彈指之間的事,更不用說是多變量分析了。電腦讓統計變簡單,並不代表學統計沒有用了,並不代表數學不見了,因為數學正是這些電腦統計軟體的背書,是理論的基礎。其實我們真正該考慮的一點是改革統計教育,因為在這個電腦時代裡教學生去算微積分、去背公式,都是沒有意義的動作,現在MAPLE、MATHMATICS、MATLAB等等軟體都可以解決高等微積分的問題,重點應該是教導學生如何去利用這些工具,如何去應用,我們教初等統計學時,一開始就是一堆 、 、 什麼的,商學系的學生一看就昏倒,該教的是讓他們知道統計有什麼用,變異數是什麼意義、迴歸分析的應用範圍在哪裡、機率分配的定義是什麼、資料分析該怎麼進行、而不是一開始在前三章就硬塞一堆分佈跟公式,看到這些統計公式很多人就傻眼了,因而對統計產生距離感,其實統計應該是一個很親切、很實在的東西,和電腦結合後更是形成一種非常powerful的工具,這些都是我實現於教學及工作上的的觀點。
統計一定要跟資訊結合,而非哪一方併掉哪一方,現在如果有人還存有誰併誰的觀念,它不但不懂資訊,更不懂統計!更甚者有人認為要裁掉統計基層調查網,裁吧!裁了就知道厲害了,建立一個調查網十分不易,改善調查網更是重要,既然已經辛辛苦苦地建好調查網,怎麼可以隨便撤掉呢?少了調查網的話,物價怎麼出來?人力資源報告怎麼出來?將來整個世界評比的結果,我們的統計指標會是倒數幾名,那麼誰還敢相信我們的東西?就像現在的中國大陸,大家都拿他們的統計指標再乘上某數,調查物價時不許抽樣的物品漲價,其他的漲翻天都不管,這叫做控制物價指數,像這樣的指數能相信嗎?這樣還需要調查嗎?我告訴你就好了嘛!這種情形就是不懂統計的人在做統計,所以統計人應該很誠懇的告訴他們若是失去這片天地會造成多大的影響,並不是我們在自吹自擂,而是統計的確有其實用性,沒有統計的話,所作決策失敗的機率就愈高,這一點身為決策者應該讓主管了解。至於統計在未來學界的發展,刁院士已於清大籌設一個整合數量、計量、經濟、企管、財經各領域的人才的組織,並報導在經濟日報上,因為台灣正朝向亞太營運中心的目標邁進,所以培養計量分析人才是當務之急,而統計就是計量分析的基礎,這是一個未來極具前瞻性的發展。統計現正在主計處中部辦公室大力持續推動支持下要成立統計資料庫,相信一定會開花結果的。另外全球商情資訊系統也已進軍台灣,因為在台灣的資料庫有相當豐富的商機,尤其是統計資料庫,因此公務單位必須正視這個問題,這也就是我一直強調的將資訊與統計結合以發揮相乘效果,而不是誰併誰這種無稽的想法。
SCIENCE有一篇文章列出近百年來最有用的科學,統計高居前十名,而統計在各領域中扮演的是服務大眾的角色,是整合所有資料及資訊的重要角色。而台灣在統計方面的另一個發展方現就是consultant center,如今幾乎每一個大學統計系都已經成立統計諮詢顧問中心,無論逢甲也好、東海也好,希望政府中的統計相關單位能盡量利用,就近詢問這些統計諮詢顧問中心,相信他們都會很樂意幫忙的。不管是學界或業界,統計有用的觀念已經漸漸形成,並且已有人開始構思成立類似企管顧問公司或諮詢顧問公司一般的統計諮詢顧問公司,因為資料愈來愈有用,賣資料正是時勢所趨,例如民間單位的中華徵信社,他們每年賺的錢其實有一部分是大家幫他們賺的,因為他們把蒐集到的統計資料經過加工處理後再賣給廠商,一賣就是十萬二十萬,所以像我們這些經常在做資料生產者的人卻沒有進一步成為資料的加工者或再製造者,其實是非常可惜的,大家應該考慮結合成立統計諮詢顧問中心來進一步運用統計。
在台灣統計的發展根據國科會自然處的統計小組所擬出來的包括有理論統計以及應用統計,所謂應用統計則包含工業統計及生物統計等等,我總覺得少了一種很重要的統計--政府統計,在國外,無論是瑞士、瑞典或美國等國家,最重視的就是政府統計,因為政府統計是一個最大的資料來源。在台灣普遍存在一種情形,就是統計領域的上中下游常出現斷層,我常說我是個 陽春 教授,是統計黑手,要是你有問題找我解決,我不見得會用很有學問的方法幫你解決,可能是找個比較實用的方法來處理問題,其實台灣有許多功力高強的學者,但是他們通常不願意下海當黑手,這就是上游不見得願意幫忙中下游解決問題,而中下游又感覺上游遙不可及,不敢把問題告訴上游,覺得上游的理論太過高深,聽過降龍十八掌,卻又不知道是哪十八掌,是故上中下游的循環發生斷層,這是我認為應該加強的地方。另外還有一個重要的問題是應該淡化統計的理學院色彩,現在統計這領域愈來愈偏向管理學院或商學院,目的就是希望統計在這些領域中和其他學科互相結合。以美國ASA section的home page為例,其中分成許多的section,連統計畫圖都自成一個section,環境方面、體育方面無所不包,提到體育,美國之所以能成為體育強國,中國大陸之所以能培養出那麼多優秀運動員,都應該歸功於他們的體育分析做的好。其他還有醫藥方面的衛生統計及公共衛生,社經方面的民意調查,在此不一一介紹,由此可知他們是多麼重視統計,沒有統計對他們而言就像是斷手斷腳一般,我們身為統計人就是應該讓主管及決策者認為沒有統計就好像缺手缺腳似的不便。我現在每個月固定在學校扮演一種角色,就是把省府的統計月報以及主計處的重要國情統計等重要的資訊摘要整理後提供各系參用,讓各系定期感受我們整個國家社會的脈動,試驗兩個月後,我想停掉這個工作,結果至少有二十個系主任打電話請我不要停,他們覺得這些資料對他們很有用,從這一點看來我是成功了,所以只要願意花心思去凸顯統計在各單位的整合性,一定可以讓人家感受到有統計是多麼方便。比方要分析交通業務,只要跟業務單位充分配合,無論是載客量或交通流量,當你分析完成後,有你沒有你就出現很大的差異了,統計在這個單位中一定會愈來愈吃香,變成一個不可或缺的重要決策資源單位。
主計長曾指導過關於統計的分析觀點以及技巧,希望在各領域中奮鬥的統計人也都能有這種認知,那就是要對數字有感情,有這種感覺後便更能掌握數字,更知道如何將數字便成有用的資訊,提供決策者參考,如此才能在基礎中不斷求新求變。
每個人都經常會為了許多事情煩惱,會為了生、老、病、死擔憂,至於統計人應如何利用統計的觀點去面對人生呢,就我而言也許有點像三國演義的卷頭語寫的「滾滾長江東逝水,浪花淘進英雄,是非成敗轉頭空,青山依舊在,幾度夕陽紅,白髮漁樵江渚上,慣看秋月春風,一壺酌酒喜相逢,古今多少事,都附笑談中」。如同前面所提,沒有永遠的永久,統計訴說的只是一個趨勢,預測一個現象,這些趨勢和現象會隨著時間的變動、隨著物換星移,永遠無法有人能掌握永久,假使有人問我時間序列分析能不能預測到十年後、二十年後、甚至三十年後,我會說「你是瘋子」,那是不可能的!統計掌握住的是趨勢,它能告訴你在不同時間的不同變數有什麼不同的看法,模式如何隨之修正,所以不管從縱切面或橫切面去了解統計給你的趨勢,進而掌握這個趨勢,才去下比較正確的判斷,這不僅僅是統計人的工作與職責,更是統計人的人生觀,統計人並不是差不多先生,統計人看的開、達觀、豁達、不爭名、也不求利。
留言列表