SPSS22新功能─反覆加權 @ 晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地） :: 痞客邦 ::

公告版位

晨晰統計顧問有限公司在新北市板橋\服務市話：02-29602817\手機：0918-276-622\信箱：raising.statistic@gmail.com\網址：http://www.rai-stat.com.tw

Oct 20 Mon 2014 09:28
SPSS22新功能─反覆加權

筆者在2012年底曾寫了二篇文章，討論樣本加權，即樣本與母體在背景變項上有明顯不同時，對樣本分析時加權處理。

當時提到，如果你可以蒐集母體各種背景變項的聯合分布，只要將每一細格的母體比例除以樣本比例（當時文中將二者反置，在此一併更正），即可得到每一樣本的權數；但如果，你只蒐集到母體邊際分布，便須用反覆加權(Raking)，當時介紹的軟體是Xlstat。但畢竟為了一根牛毛，去養一頭牛，不值得。

事隔不到一年，我們最愛用的SPSS出了22版，這版最大的改變是，Essentials for Python預設隨IBM SPSS Statistics 22安裝。SPSS透過連結Python，增加了許多新功能，包括了今天要介紹的反覆加權。廢話不多說，直接秀例子。

這個方法在SPSS22中叫Rake weights（中文叫傾斜權重，很難理解的翻譯），假設我們有200人的樣本，背景資料為性別與年齡。原始人數分布如下：

而我們所蒐集到的母體背景分布如下，明顯與樣本不同。

性別 > 男：女=38%：62%

年齡 > 20歲以下： 21~40歲：41歲以上=20%：50%：30%

這時我們可以使用SPSS22的新功能來計算權數，資料－>傾斜加權

這時我們使用SPSS22的新功能來計算權數，［資料］－>［傾斜加權］，出現右上圖對話框。

第1格［要建立的加權變數］：自訂一個變項名稱，用來放置權數；

［控制項總計變數］：選入加權用的背景變項，最多五個（如果用語法執行，則最多十個）；

［種類和控制項總計或分數］：填入母體的人數或比例、小數皆可，如附圖或1　3800　2　6200；

按［確定］即可。

首先看輸出報表，它指出Gender=1(男)、Age=1(20歲以下)的人權重為0.794，餘此類推。

回到資料檢視可發現多了一欄weight，如果我們以此加權，則結果的分布就跟母體一模一樣。

最後說明一下權數的意義，比如第一個人權重0.488，代表樣本中這一類背景的人太多，為符合母體，應予縮小。故計算該類背景受訪者的意見時，每個樣本不當1人計，而是以0.488人計。

同理，第二個人權重2.816，代表樣本中這一類背景的人太少，為符合母體，必須放大。故計算該類背景受訪者的意見時，每個樣本不只當1人計，而是當2.816人計。

如此，透過人數計算的縮小或放大，使得加權後樣本的評分、喜好，更符合母體。

對我們這群SPSS愛用者來說，SPSS愈強大，愈是省了我們很多功夫在找工具。

晨晰部落格新站

晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

晨晰部落格新站發表在痞客邦留言(0) 人氣()

E-mail轉寄

全站分類：進修深造
個人分類：Excel與統計軟體
此分類上一篇：使用SPSS的三個小技巧 Part II~使用SPSS的三个小技巧 Part II（林星帆顧問整理）
此分類下一篇： SPSS統計圖形編輯技巧(1)－林星帆顧問整理
上一篇：投稿期刊時要注意的事－時間議題（time issue） ~林星帆顧問整理
下一篇：投稿期刊時要注意的事－時間議題（time issue）Part 2 ~林星帆顧問整理

歷史上的今天

2008: 論文遭外傳 364碩、博士獲賠

留言列表

熱門文章

文章分類

最新文章

最新留言

文章精選

所有文章列表

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

本日人氣：
累積人氣：

QR Code

qrcode

POWERED BY

(登入)

{{ article.user_name }}
{{ article.timestamp * 1000 | date:'MMM.dd.y.hh.mm' }}
{{ article.title }}
{{ article.content }}

PIXNET Facebook Yahoo! Google MSN

您尚未登入，將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼：

看不懂,換張圖

請輸入驗證碼