階段二:資料運算

 

 

資料運算階段分作初階與進階,初階的運算有很多軟體

都可以協助處理,像是EXCEL的樞紐分析,可以快速的

幫忙整理大量的資料,算出平均數與標準差等數值,資

料輸出後也可以進行排序,非常方便。或者像資料庫--

MSSQL之類的軟體,可以利用寫程式的方式來「撈」資料

,再依據各種需求來做資料整理、排序、轉置及合併等

等。資料庫軟體對操作上百萬筆的資料時特別有效率,

但使用門檻較高,不如Excel那麼人性化。

 

 

初階的功能加以組合模組化,就可形成進階的套裝軟體

,譬如在EXCEL中有許多的「方程式」(function)可用來

進行資料處理,但是這些「方程式」是零散的、獨立的

(初階),如何整併成可套用於一種(或多種)常見狀

況的組合型「方程式」呢?只要巧妙的組合10種左右常

用的EXCEL「方程式」威力就相當驚人,再配上巨集以及

一點Visual Basic語法的魔咒,「一鍵式」的資料處理

功能呼之欲出。但是這個階段要模組化真正的關鍵在於

:要對資料型態有正確觀念,有好的分類才能做出最有

效益的模組,一般軟體工程師腦中數值型態與學過統計

的人數值四大分類不太一樣,integerfloat的分類跟

NominalInterval的分類畢竟是不一樣的。也難怪微軟

每天忙著更新版本,但都沒有更新加強這麼重要的統計

模組,也許是他們忙著與「水果」搏鬥,沒時時間想

那麼多吧。

 

 

階段三:資料統計分析

 

 

 

基礎的資料運算完成後距離資料統計分析還差一大步,

把資料整理好但是如何順利的讓電腦做統計分析呢?電

腦是笨的但服從性高(指令讓它做甚麼,它從不漏做)

人是聰明的但服從性低(常因為思想出小差而犯人為性

錯誤),那如何讓兩者結合之後產出正確而有效率的結

果呢?答案非常抽象,但是也非常明確,那就是「問出

一系列的好問題」,讓聰明的人回答,讓服從性高的電

腦根據回答結果來執行分析。

 

 

 

「不懂統計的人就無法享受統計分析美好的結果」,這

就是統計藝術停滯的根本原因(反觀不懂電腦與網路的

人卻每天在上網用電腦喔,讓我們在心理默默的感謝微

軟),但是不懂統計的人卻是可以在短時間內被教育而

了解自己需要(或想要)什麼樣的結果(統計結果)。

這個階段的設計有點像是迷宮遊戲,先教育使用者了解

迷宮的出發點與終點,然後用一系列的好問題引導他從

起點走到終點,這就是資料統計分析模組化的唯一方法

,巧妙的點在於:問出最精確的問題,走最快的道路,

得到最正確的結果。

 

 

 

 

階段四:結果呈現

 

 

在結果呈現有兩個重點,第一個重點是自動彙整出「要的

」結果,第二個重點是讓閱讀者輕易了解或是讓報告者更

輕鬆的說明統計結果。所謂「要的」結果一定是預設的,

所以如何決斷哪些是要的結果肯定是經驗的產物,好消息

是這些原則並不會短時間內大幅度改變。像是以前我們有

為國內某個大車廠做過產品調查的季報,他們會希望每次

結果呈現都把分數最高的前三名列出來,列在每張表或是

圖的前面,這就是一種需求與一種原則,只要有原則讓電

腦自動篩選整理出結果是絕對沒問題的。至於第二個重點

就更是藝術了,我舉Xcelsius軟體來說明會更好體會,這

個軟體能協助我們製作出動態的統計圖表。如下圖所示,

當我們的滑鼠移動到上方圓餅圖的不同區塊時,下方的長

條圖也會隨之改變,這樣一來我們可以很清楚且輕鬆的表

達不同區塊內發生的變化與差異。當然這只是「讓閱讀者

輕易了解」其中的一個環節,總體而言,圖表化、摘要式

、口語化、編排流暢性還有很多地方可以下手來強化,

需要各種的人才一起來參與。

 

 

 

 

通過了黑盒子四大階段之後,剩下的就是讓使用者了解

統計結果與應用這些結果,基本上晨晰統計現階段在做

的就是這一塊。透過每年數千小時的統計諮詢慢慢的慢

慢的在教育市場,這是一種必需的累積,畢竟統計要深

耕要發芽是需要多數人的心底都有點統計的概念,一點

點也好,只要大家都有一點點概念,就有機會連成線畫

成面,到時黑盒子就會水到渠成的被突破而產生新的產

品、新的模式、新的機會、新的生活方式。

 

 

 

 

如果這篇文章你看完感覺模模糊糊,不知道在幹嘛,沒

關係因為你是使用者。如果你感覺熱血沸騰,有新的思

維,那很好,讓我們一起創造新的時代吧!


 

 

 

 

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()