記得當初剛進入教育測驗統計研究所的第一堂課,即是「試題反應理論」(Item response theory, 簡稱IRT),雖然上了一學期的課,但還是沒什麼概念,難度(diffculty)、鑑別度(discrimination)和猜測度(guessing),應該是我上完這課程印象最深刻的三個名詞吧!

 

 

評量與測驗是評鑑學生學習成效最好的方式,亦是評斷學生優劣最好的標準,因此公正的評量與測驗就顯得相當重要,想一想我們以前在學校的考試成績真的就是我們真正的分數嗎?那怎麼出題目才算公平?如何計算分數才算公正呢?因此一群心理計量學者提出了試題反應理論,來解決這些問題,利用了統計方法,使得計算出來的分數更為客觀且公平。

 

 

隨著電腦技術的進步,許多有關IRT的文獻研究不斷地出現,研究議題五花八門,看似每個研究都有使用IRT,卻又不全然使用,這是因為IRT所應用的領域非常廣範,所以易造成初學者的混淆。那麼對一位初學者而言,應該從何學起呢:

 

 

(1)找好的參考書

對一位初學者而言,參考書是非常重要的,其中王寶墉教授的現代測驗理論應該是大多數人首推的參考書,而我覺得余民寧教授所著作的「IRT學理與應用」,是很適合初學者研讀的一本參考書,文中有一系列文章對IRT詳盡的介紹,更能讓初學者對於測驗理論的發展趨勢與IRT未來的應用有深入的了解。

 

 

(2)深入一套軟體

除了學習理論,實務的操作亦是相當重要,或者說對於初學者而言,實務相對理論還來的重要(我想初學者應該不是為了變成大師級人物而學IRT的吧)。隨著電腦技術的進步,用手估算參數的人越來越少了(還有人嗎?),所以我們要靠Computer來幫我們估算。

 

現在硬體準備好了,就尋找一個好上手的軟體吧,「BILOG」應該是最符合此定義的IRT軟體,也是我第一個學習的IRT軟體。除了點選的操作介面,亦帶有語法的功能,只要對於語法作些微的修改,就能讓使用者方便使用。再者,BILOG是許多IRT的研究者使用過的軟體,對於一位初學者來說,如果有問題會有更多人可以尋問,何樂而不為呢?

 

 

(3)先去上課

國內有一些教育單位(例如:http://www.capt.tw/workshop2008/index.html)會不定時開設與IRT有關的工作坊,邀請IRT的相關研究者或大師授課,讓一些對IRT有興趣的研究者,有一個良好的學習環境。這樣學習不但能學到IRT的基礎知識,亦可從相關軟體操作,讓研究者能夠作理論與實務的結合,多注意此方面的訊息,相信對IRT的初學者有一個更深刻的開始。

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(2) 人氣()