多年的統計工作經驗,已經毫不懷疑的相信”統計”的重要性與實用性;我們也希望設計更多課程,將統計觀念和正確作法推廣出去,讓更多需要的人受惠。
不過,國內大多數人的統計學習經驗,大多是在大學、研究所階段才獲得,而且一接觸即是生硬或堅澀的假設和公式,知其然,不知其所以然。當問題出現的形式改變,即難以變通理解,不知所措。
例如統計的檢定,大家朗朗上口的是-----虛無假設是OOO,對立假設是XXX;當p<.05時,拒絕虛無假設。這是一個很標準的決策流程,甚至變成口號了,但為什麼要這樣做?統計學老師好像沒告訴我們!!
你知道它是基於「否證論」的觀點發展出來的科學嗎?
你知道它是二十世紀初,英國統計大師費雪(R.A. Fisher)的發現嗎?
你知道它是從英國上流社會喝下午茶時的遊戲開始的嗎?
你知道p代表的真正意義嗎?為什麼 <.05是顯著呢?
「本來就是這樣啊!書上寫的。」「大家都這樣做!」恐怕是多數人的答案。其實也不能怪統計學老師,因為大學或研究所課程太緊湊了,而且學生急著應用,沒有太多時間跟學生講統計故事、玩機率遊戲,只能條例式、口號式的把所有規則統統塞給你,反正你照著做就對了。真是#@%^&*.....。
記得2010年南非世界盃足球賽中最出風頭的是誰?恐怕大家只記得那隻神準的「章魚哥」!除了讚嘆衪的神奇外,有沒有想到衪為什麼會引起話題呢?尤其在猜中前三、四場時,其實並沒有引起太多注意。是後來猜中場次愈來愈多,大家才開始從原本的飯後娛樂,轉變為半信半疑,並且認真的研究衪的神奇之處。關鍵在那?沒錯,是連續猜中的場次,這其實是機率的問題。
試想,大多數人都認為章魚不可能預測比賽結果,這可能是一個事實,但也可以說它是一個假設,一個虛無假設(null hypothesis)。虛無假設通常表示現況,而對立假設(alternative hypothesis)表示我們傾向相信的,也就是想證明它是真者。可以說虛無假設是一個靶,我們想辦法要打倒它。
只不過,虛無假設是被保護的,除非證據夠強,否則不輕易推翻現況,否則一旦宣布後,便很難被更改或挽回,所以大家下決定前,會考慮得更周全。另外,你們大概可以明白「虛無」二字的意義。如果檢定結果宣布章魚不會預測,這種結論可能沒有幾個人有興趣。社會大眾有興趣的結論是拒絕虛無假設!
問題是:證據力要多強呢?回到章魚哥例子,如果認為衪只是瞎矇,當衪連續猜中三場時,發生的機率有多高呢?1/3,即12.5%;四場呢?6.25%;如果是連續十場呢?0.097%。這時侯人們的信心開始動搖了,因為這個機率太低了,不得不相信衪真的知道比賽結果,這個機率就是p值的由來。當普遍認為衪不會猜中,但卻發生了,就有可能要推翻原來的想法。只是這個機率要多低、多罕見,各個領域不同,統計學提出了5%、1%的標準,只要某次事件的發生機率低於5%、1%,我們就有理由相信,它不是來自現況(虛無假設)。
總之,一個機率低、很罕見的事情發生了,總是會引起懷疑的。
留言列表