我們常常想要去檢樣我們的樣本是否高於、低於或等於某一特定值,因此要以樣本的平均數去和某一特定值做比較(像是班上的成績與全校平均成績80分是否有差異),此時我們就以單一樣本T檢定來檢驗們想要知道的答案。
首先我們必須先知道考驗統計量:t = (樣本平均數-特定值)/(標準差/樣本數開根號),若以下列為例子t = (41-36)/(3.59/10開根號) = 4.4,皆著再查表t0.975、10-1=t0.975、9= 2.262,可知4.4>2.262,因此達統計顯著水準(設顯著水準為0.05),表示班上學生的體重與全國國一學生平均體重36kg的確有差異性存在。
Ex:現在我們想考驗班上10名學生與全國國一學生的體重是否不同(全國=36)
ID |
體重 |
1 |
42 |
2 |
36 |
3 |
46 |
4 |
43 |
5 |
41 |
6 |
35 |
7 |
43 |
8 |
45 |
9 |
40 |
10 |
39 |
全國學生 |
36 |
(1)語法
1.對OUTPUT做設定值調整,使得OUTPUT較容易閱讀
不用更改語法,適合使用者直接貼在分析語法的最前面!!
2.設定原始資料集
現在要將我們的資料輸入到SAS裡,
DATA A是指設定一個叫做A的資料集
INPUT X是指設定一個叫X的變數
@@是指在讀取資料時要連續讀取
CARD是指開始輸入我們的資料
3.計算出我們需要的統計量
由於要利用t考驗統計量的公式來做考驗,因此我們必須先計算樣本的個數、平均數及標準差,以方便我們直接帶入公式
PROC MEANS是指執行描述性統計
N、MEAN、STD是指描述性統計裡要求計算樣本的個數、平均數及標準差
VAR X是指指定要分析的變數(剛剛在輸入資料時已命名為X)
OUTPUT是指將計算出來的數值輸出在一個OUTPUT上
OUT=STAT是指將這個OUTPUT命名為STAT
N=N、MEAN=M、STD=S是指將計算出來的N、MEAN、STD設為N、M、S
4.計算t考驗統計量並檢定其顯著性
DATA B是指設定一個叫做B的資料集
SET STAT是指將資料集B讀取STAT OUTPUT
U=36是指令U=36以方便帶入公式(欲檢定值為36)
t=(M-U)/(S/SQRT(N))是指將剛剛所計算的N、M、S代入統計量t,而SQRT(N)是指對樣本數開根號
t=ROUND(t,.01)是指將計算出來的T取到小數點第2位
PT=(1-PROBT(ABS(t),N-1))*2是指考驗統計量之機率(在此是雙尾檢定所以要乘以2)
********************註:t考驗*********************
單尾左側:PT= PROBT(t 、df)
單尾右側:PT=1 - PROBT(t 、df)
雙尾:PT=(1-PROBT(ABS(t),N-1))*2
*****************************************************
FILE PRINT是指設定我們想要列出的OUTPUT
PUT 'TEST STATISTICS: t = ' t ' (P = 'PT') ',在PUT的兩個單引號中間放想要輸出的字眼,若此時字眼中又出現單引號,那麼單引號裡的符號會去抓取上述設定的數值,像是『t』會去抓取t=(M-U)/(S/SQRT(N))且t=ROUND(t,.01)計算出來的數值
(2)報表
1執行分析的開始時間
應該不重要吧!!
2描術性統計
在語法3所計算出來的數值,由表可知個數為10個,平均數為41,標準差為3.5901099
3.T檢定考驗結果
經計算出來的結果,t值為4.4,顯著性p值為0.0017203785,若我們設顯著水準為0.05的話,那麼檢定結果會達到統計上的顯著,因此我們可以下結論說:班上學生的體重與全國國一學生平均體重36kg的確有差異性存在。
眼尖的你是否發現一件奇怪的事呢??剛剛我們設定T值取到小數第2位,可是為何OUTPUT只取到小數第一位呢?這是由於T值計算出來為4.40,所以會把0去掉。