如何快速的檢索文章

 

【檢索策略】

    所謂檢索策略,依Hartley等人的定義是指:如何避免找到不相關文章的方法或是處理找到過多或過少相關文章的可能對策。簡單的說,則如Bates的定義:是針對一檢索問題之通盤考量或全面性規劃。因此,為節省資源蒐尋的時間,且確保蒐集到的都是真正所需的資源,實有必要擬定檢索策略,按照步驟逐一進行。以下為擬定檢索策略的步驟圖:

 

 

 

 

 

【選擇需求詞彙】

 

檢索步驟中,詞彙的選擇是非常重要的一環。選擇適當,會縮短許多檢索時間,一旦選擇不當,不僅查詢不到所需資料,還得耗費許多無謂的時間。以下就選擇詞彙應注意事項提出說明:

 

U主題不熟

如果對主題不熟悉,可採用關鍵性的文獻以確認檢索詞彙和釐清概念。宜避免選擇太廣泛或模糊的詞彙檢索,且可以儲存並重複使用相同的概念和檢索策略以節省檢索時間。

 

 

U利用控制詞彙

控制詞彙是指採用預先制定的標準詞彙做為索引和檢索的工具,可以解決同義詞、類同義詞及同形異義詞的問題。使用時,可利用系統所提供的索引典、詞彙表,或是查詢分類法、標題表等進行檢索。

 

 

U相關詞彙

檢索時除了利用選定的檢索詞彙進行檢索外,也可利用索引典、標題表或系統自動提供之相關詞進行檢索,以增加檢索結果。

 

U反義詞

可利用檢索詞彙的反義詞進行檢索,已獲取相關主題的文章。

 

 

U詞彙變化

使用英文作為檢索詞彙時,宜特別注意不同詞性、單複數及英美不同寫法的變化。有些資料庫允許詞彙變化,有些則否,此時就得考慮使用切截的技巧進行檢索。

 

 

U利用相關書目找尋詞彙

在尋找檢索詞彙時,可以利用手邊文獻的相關書目,再查尋更多合適的檢索詞彙。

 

【補充:其實針對學術文獻搜尋的初學者而言,最一開始最好的檢索策略就是從幾篇關鍵參考文獻開始找起,從後面的參考文獻清單挑選看起來比較有關連性的文章或書籍,這樣找到有關連性的時間成本最低且效率最高。】

 

U同義詞、同形異義詞

若所選擇的詞彙是有許多同義詞可以都納入檢索詞彙中,若為同形異義詞,則需要在檢索時多加些條件做限定,以免查出許多不相關的文獻。

 

補充:現在很多資料庫都有提供Boolean查詢的功能,如果說你所查詢的關鍵字不夠特定,也就是說會查詢到很多無關緊要的文獻時,可以善用「Not」以及「And」的功能,另外也可針對檢索項目作限制,譬如說對Title / Document title / Publication title etc

 

U注意停用字、常用或無關緊要字

通常系統會將定冠詞(theaan)或介係詞(ofinon)當作停用字(Stop Words),另外如決定(determining)、研究(research)、趨勢(trends)這些常用或無關緊要字,不宜使用這些字作檢索。

 

 

U自然語言與控制詞彙的轉換

可多利用自然語言與控制詞彙的轉換進行檢索,以查詢到較多的文獻。

 

 

U注意使用的資料庫「隱含性的概念」

選擇詞彙時,需注意「隱含性概念」和資料庫的關係。例如:欲研究的主題為「醫學倫理對於醫學教育的重要性」,想利用Medline搜尋相關文獻。因Medline收錄的多為醫學相關文獻,若關鍵詞輸入「醫學(medicine)」則結果可能出現上萬筆,因為「醫學(medicine)」為Medline資料庫的隱含性概念。故宜選用「倫理(ethic)」與「教育(education)」兩個詞彙作為檢索詞彙。

 

 

 

選擇資料類型及資料庫

 

不同的資料類型,就應選用不同的資料庫。例如:「中華民國期刊論文索引」資料庫就是查找期刊使用【備註:現在已改版為期刊文獻資訊網之中文期刊篇目系統,但須購買點數且僅能線上觀看檔案;近年有一個比較新的中文期刊資料庫,叫做CEPS思博網,收錄的期刊數頗多,而且可以下載到pdf檔,以方便收藏,通常一般大專院校都有購買這個資料庫的授權】;「中華博碩士論文」資料庫就適合搜尋學位論文。而各種資料類型有其特色,應按照自己的需求選用。【備註:現在已改名為全國博碩士論文資訊網,且近年已規定一定要上傳到國圖,才能辦離校手續,因此幾乎國內博碩士論文至少都可查詢到摘要;再者,由於本文年代較久,當時各校不見得有建議學位論文系統,但近幾年幾乎每一所學校都有各校的學位論文系統,一般使用者直接上網嘗試下載全文】

 

 

 

另外,使用資料庫前最好先閱讀使用手冊,瞭解資料庫有什麼地方需要特別注意的,例如:

 

【備註:以上的期刊部分,特別推薦Google scholar其適合剛開始搜尋的階段來使用,譬如目前僅知道兩組關鍵字,那麼可先利用Google scholar交叉搜尋近年來的各類學術性文獻,至少包括書籍、期刊、博碩士論文以及會議摘要,主要以英文文獻為主,其搜尋威力非常強大,且與文獻搜尋軟體EndNote、Refwork等有連結功能,對於要作文獻整理的人也有事半功倍之效。】

 

 

U收錄的時間範圍

通常收錄時間的範圍愈長,可檢索到較多的資料

 

U收錄的內容主題

各資料庫所收錄的主題不同,例如:Medline是以醫學為主、PsycLIT/PsycINFO則是心理學為主要收錄主題,在使用前宜先確認,以免浪費時間做無謂的檢索。

 

 

U使用時須注意的事項

各資料庫的使用方法或多或少會不一樣,使用前應先閱讀其使用手冊,瞭解其檢索時的注意事項,例如:切截符號為何?可否使用布林邏輯檢索?

 

U需不需要收費

並不是所有的資料庫使用都是免費的,因此在使用前宜先瞭解此資料庫是否需要收費?收費標準為何?若不注意此項,之後就有可能因檢索而收到一大筆的帳單。

 

【備註:這應該是不會遇到的事,因為付費資料庫通常都要有帳號登入,或者是會認網路的IP才能登入,舉EBSCO為例,我如果沒有在校內或設定校外連線,其實我連登入資料庫的權限都沒有。】

 

U內容為學術性或通俗性

雖然選擇的資料庫是符合您所需要的主題,但仍需注意其內容是否具有學術性。若是選用到較通俗的資料庫,則其內容的學術參考價值會較低。

 

U資料內容的類型

資料庫依內容類型可分為書目型、摘要型、全文型等。一般而言,如果選用的主題有全文型的資料庫,都會優先使用,以減少需再找尋全文資料的時間。

 

【備註:這邊有兩個摘要型資料庫例外,第一個為Google scholar(有網路就可以連上、free access上一段我已提到它的搜尋威力非常強大,雖然不見得能直接取得全文,但至少能搜尋到這世上究竟哪些地方有出版類似主題的學術文獻,而且一定可以知道文獻的來源;第二個是ISI web of knowledge,就是人家俗稱的SSCISCI的學術搜尋網站,這個網站也並非全文型的,但是它會根據你所搜尋到的文獻資訊,連結到擁有全文的電子資料庫(如果有電子全文的話),然後如果您的學校有購買該電子資料庫,那麼ISI web of knowledge會直接連結到該資料庫並下載全文,也就是說,您不需要再另外登入其他電子資料庫就可以下載到全文,非常方便】

 

U提供檢索的欄位

有些資料庫僅提供簡易檢索,這樣的方式方便使用者利用關鍵詞快速檢索,但往往檢索的結果準確率不高;有些資料庫尚提供詳細查詢,可以利用多個欄位做限制,以增加準確率。【備註:現在的學術資料庫都已經有詳細查詢的功能,至少都可以自訂3個欄位作限制】

 

 

檢索技巧

 

檢索技巧是為完成特定目的所採取的行動,即使檢索策略非常完善,但若未選用適當的檢索技巧也為枉然,因此檢索技巧對於提高檢索品質非常重要。以下就幾種常用技巧加以介紹:

 

U布林邏輯(Boolean Logic)

是利用布林邏輯運算元AND / OR / NOT進行一個以上的檢索詞彙的組合檢索,以利檢索範圍的縮小或擴大。

 

  FAND所選用之檢索詞彙以AND作交集,以縮小檢索範圍。例如:「醫學AND倫理」,則檢索結果為「醫學倫理」相關文獻。

FOR所選用之檢索詞彙以OR作聯集,以擴大檢索範圍。例如:「醫學OR倫理」,則檢索結果為「醫學」及「倫理」兩部分的相關文獻。

 

 

 

FNOT使用NOT將檢索結果排除不用之檢索詞彙,以使檢索結果更為精確。例如:「醫學倫理NOT教育」,則檢索結果為排除「教育」後,剩餘的「醫學倫理」部分的相關文獻。

 

Ü相近()運算元:

  某些資料庫提供相近運算元的檢索,其可限定兩個檢索詞彙出現的順序及位置,例如:使用ABI/INFORM 輸入「nursing W/3 education」則表示nursing education 需間隔在三個字以內。

 

 

Ü限制檢索:

可將檢索詞彙限定在某些特定欄位進行檢索,可以增加檢索速度,並可提高精確率。【備註:一般最嚴格是限定Title, 如發現搜尋到文獻非常稀少,則可考慮放寬到Abstract or topic, 再者為不限定欄位】

 

Ü限制欄位:

檢索時可限制欄位條件,以避免檢索資料過多,如:年代、語言、出版類型等。

 

Ü完整法:

分別使用縮寫和全稱進行檢索,以確保查得完整的資訊。例如:使用作者的縮寫及全稱分別進行檢索。

 

如何修正檢索策略

檢索時所應注意的事項非常繁複,在不同的情況則可思考下列問題後,再將檢索策略加以修正:

 

Ü檢索筆數過多(指誤引過多)

  1.是否過分簡化問題?

  2.是否需要釐清檢索概念?

  3.是否使用正確的布林邏輯(應使用AND而非使用OR)

  4.是否使用過分含混或一般性的詞彙?

  5.是否應考慮使用控制詞彙?

  6.是否將相近運算元限制太鬆?

  7.是否切截使用過鬆?

  8.是否注意到資料庫的「隱含性概念」?

 

Ü檢索筆數過少(包括零筆資料)

1.是否使用符合檢索主題的資料庫進行檢索?

2.是否將問題過於複雜化?

3.是否真的沒有文獻探討該檢索主題?

4.是否已使用足夠的檢索詞彙進行檢索?

5.是否將相近運算元限制過緊?

6.是否使用正確的布林邏輯(應使用OR而非AND)

7.是否拼字或語法有誤?

8.是否考慮使用自然語言進行檢索?

9.是否考慮使用切截?

 


 

Ü想增加資料回收率(即希望檢索到較多的相關資料)

1.增加同義詞和類同義詞的數目。

2.使用較廣義的檢索詞彙。

3.以自然語言檢索代替控制詞彙。

4.不使用布林邏輯的”AND””NOT”

5.增加切截的範圍。

6.使用較鬆的相近運算元。

7.刪除一些非主題的欄位限制,例如:年代、資料型態等。

 

Ü想增加資料精確率(即希望檢索到正確的所需資料)

1.刪除部分類同義詞或是詞義含混的檢索詞彙。

2.使用專指性較高的檢索詞彙。

3.有適當的控制詞彙時,以控制詞彙代替自然語言進行檢索。

4.使用布林邏輯的”NOT”刪除一些不相關的文章。

5.限制切截的範圍。

 

參考文獻:黃慕萱(1996, 12)。檢索策略與檢索技巧在資訊檢索上之應用。 國家圖書館館刊, 85(2), 39-58

 

結語

 

檢索策略若使用得當,不僅可以快速檢索到文獻,且檢索結果的準確率也較滿意。因此檢索進行前宜先擬定檢索策略,閱讀所使用的資料庫的說明,再搭配適合之檢索技巧,則較易快速且正確的獲得所需資料。另外,最好將檢索的過程記錄下來(部分資料庫會提供檢索歷史查詢(search history)),以便追蹤、修改檢索策略,避免因重複檢索而浪費時間。

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()