公告版位
目前分類:其他類統計知識 (120)
- Jun 03 Tue 2014 10:22
用SPSS選擇樣本-下
- May 26 Mon 2014 09:14
用SPSS選擇樣本-上
通常資料鍵檔、清理及編碼完之後,就會開始進行分析!!不過有時候就得先去篩選樣本後再來進行分析,通常會發生在(1)選擇特定樣本,譬如說只分析男生,或只分析學歷在大專以上的對象;(2)針對所有樣本隨機抽取選需的份數。
情況一的部分,主要是研究者欲針對特定對象來進行統計分析,因此會在分析之前以滿足調件的方式,去篩選出特定樣本;情況二的部分則常發生在研究者僅作一次收案,但又要進行預試分析,因此針對所有資料抽取出一小部分的樣本來進行預試分析,再用剩下的資料進行正試分析。
- May 19 Mon 2014 08:58
另類文字探勘技術(續)
- Mar 24 Mon 2014 10:03
另類文字探勘技術
在鉅量資料時代,資料是多樣性的,一般常用來分析的結構化資料只佔20%,更多的是文字資料,如訪談稿、機器記錄檔(log)、FB臉書、Twitter推特、網誌、部落格、留言版等,所獲得的資料都是一堆文字,對統計學家來說,其分析意義主要在字詞出現頻率。高出現次數代表被討論或關注的頻率高,也就是該字詞可能是一種多數人的主流意見。
所以這方面分析統計方法難度並不高,重點在於如何擷取文字資料、自動辨別字詞與計數。前者會因為來源不同而需要不同的技術或軟體,而後者則需要事先建立龐大的字詞資料庫以供比對。今天筆者介紹一種應用在部落格分析上的方法,非常簡單且容易學習,最重要的是免費。
- Feb 17 Mon 2014 09:42
兩組介入性研究之GEE操作~下
- Feb 10 Mon 2014 09:01
兩組介入性研究之GEE操作~上
上一篇曾經介紹過介入性研究常使用的統計方法,有獨立樣本t檢定、成對樣本t檢定、單因子共變數分析、二因子混合設計變異數分析等,除了這些方法之外,本篇再介紹一個最近比較受歡迎的方法—廣義估計方程(Generalized estimating equation, GEE)。
嚴格來說,GEE只能算是一種估計方法而非統計方法,且建立在廣義線性模式(Generalized Linear Models, GedLM)來進行分析。那麼本篇將以一個2×2的介入性研究(兩組前後測)為例子,分享如何在SPSS以GEE進行分析。
- Dec 09 Mon 2013 09:02
SPSS長資料轉短資料
前幾篇有提到從短資料轉成長資料,不過一般來說,除非有特殊需求,否則一般較基本的統計分析皆會以短資料來進行,但小編前陣子遇到一個題目的data是給長資料,因此恰好相反,要先轉成短資料才行。那我們就拿上次已轉完的長資料(long form data)為例,試著再轉回去短資料。
- Oct 28 Mon 2013 09:05
空間統計軟體GeoDa(四)
當大家已經初步會製作視覺化統計地圖後,接下來舉一些與台灣相關的實際應用範例。
首先,主計處有建一個縣市重要統計指標查詢系統的網站,可設條件查詢各縣市的資料(http://ebas1.ebas.gov.tw/pxweb/Dialog/statfile9.asp)。下載後大概會像下表的樣子:這是其中一項指標
- Oct 14 Mon 2013 09:06
SPSS短資料轉長資料
一般在做資料鍵檔案,某一位受訪的對象都會輸入在同一列,如下圖,只要是從這位受訪受訪者搜集來的資料,無論是對某一件事測量很多次(如國文與數學各測3次),調查受訪者家中訊息(如父親年齡及同住人數),都會keyin在同一列。之所以會這樣鍵檔,除了輸入方便之外,另一個原因是幾乎大部分的分析都需要這種的資料格式才有辦法執行,而這種資料格式我們稱之為短資料(short form data)。
- Oct 07 Mon 2013 09:06
空間統計軟體GeoDa(三)
- Sep 30 Mon 2013 09:45
空間統計軟體GeoDa(二)
GeoDa的Workbook最後版本是2006/3,其後官網上就沒再看到更新,所以內容有些是以舊版的GeoDa來撰寫,但不妨礙學習,所需data也放在官網中(註1)。要注意的是,由於這是美國人寫的軟體,檔案路徑不能有中文,故不要把程式和資料檔放在桌面上。建議大家在D槽下開一個英文目錄(如D:\GeoDawork),全部放入,這樣讀檔才不會有問題。
這本手冊共分25節,前6節在練基本功,學習開檔、讀檔、資料結構、經緯度連結等,第7~12節為探索性的統計圖表呈現,第13~21節則是地圖映射、空間落遲、空間加權、空間自我相關等特殊概念,第22~25節則是從傳統迴歸延伸到空間落遲模型、空間誤差模型。
- Sep 16 Mon 2013 09:52
空間統計軟體GeoDa(一)
筆者過去曾經以「地圖空間的敘述統計」為題,發表了二篇文章,文中係以ArcGIS軟體來示範。其實,以入門者來講,這套商業軟體太龐大太貴,即使試用版也嫌安裝複雜又難學。所幸,在GIS研究領域,還有許多免費且簡易的軟體可用,且對大多數研究者綽綽有餘。這其中首推美國國科會1998 年贊助成立的「空間社會科學整合研究中心」(Center for Spatially integrated Social Sciences, CSISS),所研發推廣的免費軟體Geoda。
該軟體最早的測試版本GeoDa™ 0.9.5-i是在2003年2月發布,它是由ESRI公司(即ArcGIS的開發者)旗下產品延伸而來。2005年為了開放來源碼及在linux、Mac等平台上使用,發布了OpenGeoda版本。經過了一段時間,Geoda終於在2011/10/10發布1.0正式版,至2013/3已發布至1.4版,且可跨多個平台,全球已成立超過9萬個社群(註1)。依據2005年簡報,台灣是使用人數排名第八的國家,了不起哦!!
- Jul 15 Mon 2013 09:24
重要-表現程度分析法~Importance- Performance Analysis,IPA(下)
- Jul 08 Mon 2013 09:56
重要-表現程度分析法~Importance- Performance Analysis,IPA(上)
最近還蠻常遇到有關IPA的分析,那今天在此針對IPA的內容與操作過程做個介紹。IPA分析就如標題所示,全名叫作重要-表現分析法,研究的議題總是圍繞在服務品質上打轉,然後去搜集受訪者(顧客、消費者…等受到服務的人)對於某項服務的重視程度與感受程度,因此「重要」有時候會以「期望」、「重視」表示,而「表現」有時候則會以「感受」、「滿意」取代之,無論使用何種名詞,這類分析所使用的量表都是一個對等量表,也就是說「重要」與「表現」是用一模一樣的題目去測量受訪者的反應(如下圖)。
- Apr 15 Mon 2013 09:07
地圖空間的敘述統計(續)
前一篇文章講到,如果你有各區域的屬性資料,如各縣市的甘薯產量,或者人口數、平均房價等,只要加上空間資料(圖層),即可以用來繪製地理分布圖。其中屬性資料在上次介紹中為面資料,此處再介紹點資料。
- Apr 08 Mon 2013 09:11
地圖空間的敘述統計
在一些像農業、醫療、環境、交通、犯罪等領域的研究中,研究者對地區別的統計資料,除了用表格表示外,更常用地圖色彩的方式,呈現各區域的數量多寡或嚴重程度,例如圖1為台灣地區某一年度的法定傳染病的疾病統計,顏色愈深,代表人數越多。(http://nidss.cdc.gov.tw/index.aspx)這樣的呈現方式可以讓讀者一目了然,而且馬上抓出重點區域。
- Mar 18 Mon 2013 09:09
時間之運算(三)
(4) 根據日期/時間點,拆成不同的日期/時間變項
我們想從一個日期/時間點,去截取我們需要的某一個特定單位出來,譬如說我們keyin成年/月/日,但想統計月份出生的次數分配,所以我們只需月的資料。
- Mar 04 Mon 2013 09:10
時間之運算(一)
記得剛開始接觸護理領域的研究時,發現資料中常夾帶非常多日期/時間的變數,而這個日期/時間變數又是將年/月/日or天/時/分/秒整合在同一個欄位,無法直接分析,此時我都會搭配其他的軟體,將年/月/日拆開成3個欄位or將天/時/分/秒拆開成4個欄位,接著做一番資料處理後才開始分析,雖然只是拆開一個步驟,但這個步驟卻是時常出錯,主要因為各軟體有日期/時間格式上設定的問題,所以有時候會增加其複雜度。
- Feb 27 Wed 2013 10:59
統計在競爭態勢分析的應用(品牌替代矩陣)
前一篇文章提到(http://dasanlin888.pixnet.net/blog/post/34469795),廠商想要知道自己的產品與其它的產品的「競爭態勢」,可以透過市場佔有率的比較、產品間的替代或互補性比較,來得知彼此之間的「競爭態勢」,資料是從銷售點的POS資料中得知。