階段二:資料運算
資料運算階段分作初階與進階,初階的運算有很多軟體
都可以協助處理,像是EXCEL的樞紐分析,可以快速的
幫忙整理大量的資料,算出平均數與標準差等數值,資
料輸出後也可以進行排序,非常方便。或者像資料庫--
MSSQL之類的軟體,可以利用寫程式的方式來「撈」資料
,再依據各種需求來做資料整理、排序、轉置及合併等
等。資料庫軟體對操作上百萬筆的資料時特別有效率,
但使用門檻較高,不如Excel那麼人性化。
初階的功能加以組合模組化,就可形成進階的套裝軟體
,譬如在EXCEL中有許多的「方程式」(function)可用來
進行資料處理,但是這些「方程式」是零散的、獨立的
(初階),如何整併成可套用於一種(或多種)常見狀
況的組合型「方程式」呢?只要巧妙的組合10種左右常
用的EXCEL「方程式」威力就相當驚人,再配上巨集以及
一點Visual Basic語法的魔咒,「一鍵式」的資料處理
功能呼之欲出。但是這個階段要模組化真正的關鍵在於
:要對資料型態有正確觀念,有好的分類才能做出最有
效益的模組,一般軟體工程師腦中數值型態與學過統計
的人數值四大分類不太一樣,integer與float的分類跟
Nominal與Interval的分類畢竟是不一樣的。也難怪微軟
每天忙著更新版本,但都沒有更新加強這麼重要的統計
模組,也許…是他們忙著與「水果」搏鬥,沒時時間想
那麼多吧。
階段三:資料統計分析
基礎的資料運算完成後距離資料統計分析還差一大步,
把資料整理好但是如何順利的讓電腦做統計分析呢?電
腦是笨的但服從性高(指令讓它做甚麼,它從不漏做),
人是聰明的但服從性低(常因為思想出小差而犯人為性
錯誤),那如何讓兩者結合之後產出正確而有效率的結
果呢?答案非常抽象,但是也非常明確,那就是「問出
一系列的好問題」,讓聰明的人回答,讓服從性高的電
腦根據回答結果來執行分析。
「不懂統計的人就無法享受統計分析美好的結果」,這
就是統計藝術停滯的根本原因(反觀不懂電腦與網路的
人卻每天在上網用電腦喔,讓我們在心理默默的感謝微
軟),但是不懂統計的人卻是可以在短時間內被教育而
了解自己需要(或想要)什麼樣的結果(統計結果)。
這個階段的設計有點像是迷宮遊戲,先教育使用者了解
迷宮的出發點與終點,然後用一系列的好問題引導他從
起點走到終點,這就是資料統計分析模組化的唯一方法
,巧妙的點在於:問出最精確的問題,走最快的道路,
得到最正確的結果。
階段四:結果呈現
在結果呈現有兩個重點,第一個重點是自動彙整出「要的
」結果,第二個重點是讓閱讀者輕易了解或是讓報告者更
輕鬆的說明統計結果。所謂「要的」結果一定是預設的,
所以如何決斷哪些是要的結果肯定是經驗的產物,好消息
是這些原則並不會短時間內大幅度改變。像是以前我們有
為國內某個大車廠做過產品調查的季報,他們會希望每次
結果呈現都把分數最高的前三名列出來,列在每張表或是
圖的前面,這就是一種需求與一種原則,只要有原則讓電
腦自動篩選整理出結果是絕對沒問題的。至於第二個重點
就更是藝術了,我舉Xcelsius軟體來說明會更好體會,這
個軟體能協助我們製作出動態的統計圖表。如下圖所示,
當我們的滑鼠移動到上方圓餅圖的不同區塊時,下方的長
條圖也會隨之改變,這樣一來我們可以很清楚且輕鬆的表
達不同區塊內發生的變化與差異。當然這只是「讓閱讀者
輕易了解」其中的一個環節,總體而言,圖表化、摘要式
、口語化、編排流暢性…還有很多地方可以下手來強化,
需要各種的人才一起來參與。
通過了黑盒子四大階段之後,剩下的就是讓使用者了解
統計結果與應用這些結果,基本上晨晰統計現階段在做
的就是這一塊。透過每年數千小時的統計諮詢慢慢的慢
慢的在教育市場,這是一種必需的累積,畢竟統計要深
耕要發芽是需要多數人的心底都有點統計的概念,一點
點也好,只要大家都有一點點概念,就有機會連成線畫
成面,到時黑盒子就會水到渠成的被突破而產生新的產
品、新的模式、新的機會、新的生活方式。
如果這篇文章你看完感覺模模糊糊,不知道在幹嘛,沒
關係因為你是使用者。如果你感覺熱血沸騰,有新的思
維,那很好,讓我們一起創造新的時代吧!
留言列表