公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

目前分類:其他類統計知識 (117)

瀏覽方式: 標題列表 簡短摘要

在鉅量資料時代,資料是多樣性的,一般常用來分析的結構化資料只佔20%,更多的是文字資料,如訪談稿、機器記錄檔(log)、FB臉書、Twitter推特、網誌、部落格、留言版等,所獲得的資料都是一堆文字,對統計學家來說,其分析意義主要在字詞出現頻率。高出現次數代表被討論或關注的頻率高,也就是該字詞可能是一種多數人的主流意見。

所以這方面分析統計方法難度並不高,重點在於如何擷取文字資料、自動辨別字詞與計數。前者會因為來源不同而需要不同的技術或軟體,而後者則需要事先建立龐大的字詞資料庫以供比對。今天筆者介紹一種應用在部落格分析上的方法,非常簡單且容易學習,最重要的是免費。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

三、報表

 

晨晰部落格新站 發表在 痞客邦 留言(19) 人氣()

上一篇曾經介紹過介入性研究常使用的統計方法,有獨立樣本t檢定、成對樣本t檢定、單因子共變數分析、二因子混合設計變異數分析等,除了這些方法之外,本篇再介紹一個最近比較受歡迎的方法廣義估計方程(Generalized estimating equation, GEE)。

嚴格來說,GEE只能算是一種估計方法而非統計方法,且建立在廣義線性模式(Generalized Linear Models, GedLM)來進行分析。那麼本篇將以一個2×2的介入性研究(兩組前後測)為例子,分享如何在SPSSGEE進行分析。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

前幾篇有提到從短資料轉成長資料,不過一般來說,除非有特殊需求,否則一般較基本的統計分析皆會以短資料來進行,但小編前陣子遇到一個題目的data是給長資料,因此恰好相反,要先轉成短資料才行。那我們就拿上次已轉完的長資料(long form data)為例,試著再轉回去短資料。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當大家已經初步會製作視覺化統計地圖後,接下來舉一些與台灣相關的實際應用範例。

首先,主計處有建一個縣市重要統計指標查詢系統的網站,可設條件查詢各縣市的資料(http://ebas1.ebas.gov.tw/pxweb/Dialog/statfile9.asp)。下載後大概會像下表的樣子:這是其中一項指標

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

一般在做資料鍵檔案,某一位受訪的對象都會輸入在同一列,如下圖,只要是從這位受訪受訪者搜集來的資料,無論是對某一件事測量很多次(如國文與數學各測3次),調查受訪者家中訊息(如父親年齡及同住人數),都會keyin在同一列。之所以會這樣鍵檔,除了輸入方便之外,另一個原因是幾乎大部分的分析都需要這種的資料格式才有辦法執行,而這種資料格式我們稱之為短資料(short form data)。

 

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

 

當你已經讀進北卡羅萊納州各郡地圖(sids2.shp)後,接著我們使用軟體的探索功能(EDAESDA),進行視覺化分析。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

GeoDaWorkbook最後版本是2006/3,其後官網上就沒再看到更新,所以內容有些是以舊版的GeoDa來撰寫,但不妨礙學習,所需data也放在官網中(註1。要注意的是,由於這是美國人寫的軟體,檔案路徑不能有中文,故不要把程式和資料檔放在桌面上。建議大家在D槽下開一個英文目錄(如D:\GeoDawork),全部放入,這樣讀檔才不會有問題。

這本手冊共分25節,前6節在練基本功,學習開檔、讀檔、資料結構、經緯度連結等,第7~12節為探索性的統計圖表呈現,第13~21節則是地圖映射、空間落遲、空間加權、空間自我相關等特殊概念,第22~25節則是從傳統迴歸延伸到空間落遲模型、空間誤差模型。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者過去曾經以「地圖空間的敘述統計」為題,發表了二篇文章,文中係以ArcGIS軟體來示範。其實,以入門者來講,這套商業軟體太龐大太貴,即使試用版也嫌安裝複雜又難學。所幸,在GIS研究領域,還有許多免費且簡易的軟體可用,且對大多數研究者綽綽有餘。這其中首推美國國科會1998 年贊助成立的「空間社會科學整合研究中心」(Center for Spatially integrated Social Sciences, CSISS),所研發推廣的免費軟體Geoda

該軟體最早的測試版本GeoDa™ 0.9.5-i是在20032月發布,它是由ESRI公司(即ArcGIS的開發者)旗下產品延伸而來。2005年為了開放來源碼及在linuxMac等平台上使用,發布了OpenGeoda版本。經過了一段時間,Geoda終於在2011/10/10發布1.0正式版,至2013/3已發布至1.4版,且可跨多個平台,全球已成立超過9萬個社群(1)。依據2005年簡報,台灣是使用人數排名第八的國家,了不起哦!!

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

5)設定分割中點以形成四大象限

9.左鑑兩下點選圖形or對圖形按右鍵→SPSS圖形物件→開啟

晨晰部落格新站 發表在 痞客邦 留言(5) 人氣()

最近還蠻常遇到有關IPA的分析,那今天在此針對IPA的內容與操作過程做個介紹。IPA分析就如標題所示,全名叫作重要-表現分析法,研究的議題總是圍繞在服務品質上打轉,然後去搜集受訪者(顧客、消費者…等受到服務的人)對於某項服務的重視程度與感受程度,因此「重要」有時候會以「期望」、「重視」表示,而「表現」有時候則會以「感受」、「滿意」取代之,無論使用何種名詞,這類分析所使用的量表都是一個對等量表,也就是說「重要」與「表現」是用一模一樣的題目去測量受訪者的反應(如下圖)。

 

晨晰部落格新站 發表在 痞客邦 留言(6) 人氣()

 

前一篇文章講到,如果你有各區域的屬性資料,如各縣市的甘薯產量,或者人口數、平均房價等,只要加上空間資料(圖層),即可以用來繪製地理分布圖。其中屬性資料在上次介紹中為面資料,此處再介紹點資料。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

在一些像農業、醫療、環境、交通、犯罪等領域的研究中,研究者對地區別的統計資料,除了用表格表示外,更常用地圖色彩的方式,呈現各區域的數量多寡或嚴重程度,例如圖1為台灣地區某一年度的法定傳染病的疾病統計,顏色愈深,代表人數越多。http://nidss.cdc.gov.tw/index.aspx這樣的呈現方式可以讓讀者一目了然,而且馬上抓出重點區域。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

(4) 根據日期/時間拆成不同的日期/時間變項

我們想從一個日期/時間點,去截取我們需要的某一個特定單位出來,譬如說我們keyin成年//日,但想統計月份出生的次數分配,所以我們只需月的資料。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

(2)某一時間點去加減一段時間(duration

譬如說我們想根據指定日期去加上一段時間而得到新的日期。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

    記得剛開始接觸護理領域的研究時,發現資料中常夾帶非常多日期/時間的變數,而這個日期/時間變數又是將年//or///秒整合在同一個欄位,無法直接分析,此時我都會搭配其他的軟體,將年//日拆開成3個欄位or將天///秒拆開成4個欄位,接著做一番資料處理後才開始分析,雖然只是拆開一個步驟,但這個步驟卻是時常出錯,主要因為各軟體有日期/時間格式上設定的問題,所以有時候會增加其複雜度。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

前一篇文章提到(http://dasanlin888.pixnet.net/blog/post/34469795),廠商想要知道自己的產品與其它的產品的「競爭態勢」,可以透過市場佔有率的比較、產品間的替代或互補性比較,來得知彼此之間的「競爭態勢」,資料是從銷售點的POS資料中得知。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

廠商在作市場調查時,常想要知道的一個主題是,自己的產品與其它的產品的「競爭態勢」,這裏面包含很多的競爭關係,比如:

 

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

這裏將介紹多重反覆加權(Raking)的軟體Xlstat

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在抽樣調查時,尤其政治上的選舉民意研究,特別重視樣本的代表性問題。常見的狀況是樣本與母體在人口特性上有明顯不同,例如已知母體中男女的人數比例應為1:1,但抽取的樣本男女比例卻為2:1,此時如果進行意見的統計,則女性的意見將被低估。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼