research:bob-indexing:thesis:research

研究設計簡介
訪談
款目內容分析
方格法訪談

研究設計簡介
訪談
索引款目內容分析：
- 原則
- 款目區分
- 方格法元素抽樣與取出
方格法訪談進行
方格法訪談分析

研究設計簡介

(在研究工作中，內容分析工作與訪談工作的區別)

訪談

開放式的訪談，適合讓訪談對象在沒有限制的情境下，表達出他自己對於索引編製工作的經驗。
這樣的訪談工作，是一種研究者與受訪者的對話。
- 研究者與受訪者的關係
- 研究者盡量不要讓自己的研究論點進入
  - 研究者的修鍊
訪談的結構化。開放式的訪談容易缺少完整的結構。
- 研究者對於訪談結構的掌握。訪談的大綱擬定
- 是否要讓受訪者先接觸到訪談大綱
- 訪談的資訊不對稱觀點
- 受訪者的武器：經驗、經驗、經驗
- 研究者的武器：追問
- 研究者的武器：不同角色的訪談比較
- 研究者的武器：一次不行，再來一次
- 研究者的武器：內容分析

款目內容分析

原則

(承接前述，內容分析是研究者的武器)
- 都是研究者在研究過程中，慢慢摸索出來的
- 以下列出的論點，雖然有列出相關文獻或理論，但是最具主導性的關鍵，是研究者自己的研究過程經驗。是因為研究者自己的研究過程經驗，所遇見研究上的問題，才想要找出解決問題的方法。
研究者的研究問題，決定內容分析的對象
分析對象的決定：研究問題
- 方法論文獻：
- 本研究的實際操作：
研究者的理論基礎，決定內容分析的依據
分析的根據：研究者的理論基礎
- 方法論文獻
- 本研究的實際操作

款目區分

在初步的索引編製訪談與內容分析之後，研究者發現，在索引編製者的工作中，概念與非概念詞彙的辨識過程有很大的不同。此一論點可視為第一階段研究的發現。

(相關研究資料討論，或要參考其他章節)

因此，後續的研究中，研究者集中在概念詞彙的索引編製工作上。此一工作的進行，第一步需要找出索引編製者的概念款目編製行為，再透過資料收集以對這些行為進行研究。此處首先討論具體款目與概念款目的區分判斷：

具體款目與概念款目

這一區分是在研究中逐步發展出來的。透過數次前測工作，研究者規劃出一具體款目與概念款目的判準，並依此作為後續個案款目內容分析的依據。

(理論上的討論，或參考其他章節)

此一判準的建構，大致上經過三次的前測。第一次前測，研究者使用個案一的款目，以便利取樣的方式，根據三位同學或學妹，以口頭方式告知區分的方法，請每一位參與者各區分兩頁的索引款目。前測進行中，請參與者對於模糊或是搞不清楚的地方，直接問研究者，研究者再把這些問題與區分方法紀錄下來，建立第一版的區分判準。第二次前測，研究者以便利取樣方式，找到六位學弟妹作參與者，以分工方式，將所有個案一的索引款目全部區分完畢。如果有不確定或是有疑問的部分，在款目前面畫圈註記。研究者也在旁邊，如果有問題的話，也直接與參與者討論。然後研究再根據第二次前測的問題，修改成為第二版的區分判準。再請另外兩位同學，各以一杯珍珠奶茶的代價，根據第二版區分判準，進行第三次區分前測。

第二版區分判準 (具體款目與概念款目區分判準說明_20060822.doc)

實際操作程序

不同個案，在款目分析階段的分析方法不同

個案一

鼎鍾文集的款目內容分析

問題與理論依據：建立具體款目與概念款目的區分
(研究情境描述)
(建立區分準則)
(款目區分前測的執行)
(款目區分前測分析)
(款目區分的結果)

根據第二版判準測試，兩位參與者，加上研究者自己的區分結果，在扣除專名後的概念詞完全一致的款目共有477條，達所有至少被一個人認定為概念款目的數量的 88.33%。而與使用第一版的前測一致性比例為高。因此研究者認為這樣的款目區分判準具有一定的一致性。研究者在針對至少被一個人以上認定為概念的款目，與內文進行檢查，排除掉因為語義不清辨識錯誤的款目，一共取得540條概念款目。

個案二

台灣文學年鑑(2005)的款目內容分析

因為索引編製者，已經作過完整的款目分類工作。根據索引編製者的款目分類原則說明，研究者將原編製者所分出的「人名類」、「書報刊名類」、「會議名稱類」、「機關類」、「學校名稱類」、「文學獎類」、「文學營類」、「論文名稱類」歸類餘具體款目。再進一步檢查餘下的兩種款目類型：「主題類」與「其他類」。
需要進一步檢查，原因有二：(1)「其他類」款目要需要進一步區分具體與概念款目；(2)即使是編製者分在「主題類」的款目，也不一定全部都是研究者所認定的概念款目。
實際檢查的結果，在總共7137條款目中，只有29條是屬於概念詞彙。比例遠低於鼎鍾文集個案。索引編製者進行了完整的款目分析工作。在編製者的規劃中，將款目分為：1.人名、2.書報刊、3.主題、4.會議名稱、5.機關、6.學校名稱、7.文學獎名稱、8.文學營、9.其他、t.論文名稱，共十項。根據訪談，這十項的區分與內涵，並非依開始就有規劃完整的，而是在編製過程中，逐步補充完成的。其中1.2.4.5.6.7.項目是較沒有疑問的；這些項目，一方面是索引常見項目，在以往的台灣文學年鑑索引中，也是既有的項目。
- 根據索引編製者原始劃記為「主題類」的款目22筆中，研究者進一步分析其款目內涵，發現其中不完全是「主題類」款目，其中尚有混雜部份的機構名稱(一陽農場)、網站名稱(手機文學館)、專欄名稱(跨界之旅)與法令名稱(政府採購法、台灣省戒嚴期間新聞雜誌圖書管制辦法)的款目。綜觀所有的款目劃記，大部份專欄名稱與網站名稱都是以「書報刊名」類別劃記，但是在一開始，編製者並沒有意識到這個類型的區分，由編製者並沒有在預先規劃的劃記類型文件中描述這兩類款目可以得到證明，因此導致錯誤分為主題類。對本個案的索引編制工作而言，這類的分類錯誤實際上並不會影響到索引編製的結果，因為最終的索引並沒有呈現出這些款目類型的資訊。法令名稱是個特例，研究者認為法令名稱應屬於具體詞彙，而非概念詞彙。當然，這點並非絕對的判斷標準，這與著作的主題與論述類型有關；一本國際智財權法的專書中，提及「著作權法」的時候，可能不是指特定的某部法令規範，而是一整個著作權法的概念；因此還必須考量行文的上下脈絡才能加以判斷。但是在此的兩筆法令款目，皆指國內特定具體的法令；即便法令仍然有可能會修改變動，但是配合著作內文脈絡觀之，應該具有相當的專指性。機構名稱(一陽農場)在原文中以引號加強，但是並不是很清楚是一個教育機構、一個佔有實際空間的場定、或是一個社會運動項目，但是還是比較傾向機構名稱。扣除掉以上項目，剩下的主題類款目區分有以下幾類：(1)文學概念：女性主義、古典文學、同志文學等，共7筆；(2)事件概念：二二八事件(二二八)、芝山巖事件、鄉土文學論戰、「溫羅汀」串連行動；(3)普通專有名詞：BLOG、部落格；(4)特定專稱：生活促進隊、和平宣言；(5)其他(通用詞彙)：架構(Framework)、綜述。
- 不屬於文學營的展覽與活動名稱，以及無法分入以上九類的款目，被索引編製者區分為「其他類」。研究者分析此類95筆款目，扣除部分應是分類錯誤的款目(如，是網站名稱、機構名稱、系統名稱)，餘下的項目中(89筆)，活動展覽佔73%(65筆)，其次是計畫名稱，佔13.48%(12筆)，這兩項加總即達86.5%。而其餘的項目筆數均不多，且與主題的區分類似，研究者將這些款目分類如下：(1)通用詞彙；(2)普通專有名詞；(3)特定專稱；(4)特定政策專稱；(5) 概念 (大河小說、文化創意產業)；(6)論題主題。
研究這兩類款目的劃記，可以對於索引編製者如何建立或是標示出一個特定概念詞彙，有一理解。

方格法元素抽樣與取出

經過款目內容分析的區分工作之後，下一部要以這些概念款目，作為方格法訪談工作中所使用的元素樣本抽樣架構。在這一個階段的抽樣中，將抽出10~15個元素樣本，作為方格法訪談的元素。將元素數量定為15個，有兩個主要的原因：

第一個是訪談的時間上限。根據Easterby-Smith(1980)對方格法訪談進行的經驗，他認為10*10的方格設計，大約需要兩個小時才能完成。這接近一般訪談工作的上限。方格法訪談的時間，除了訪談的元素與構念數量之外，訪談的風格形式也是另一種考量的因素。如果訪談包含元素與構念的引出，甚至需要使用階梯法(ladding)，探尋受訪者構念與構念間的關係，會比純粹計量研究的方格法更花時間。根據研究者在此研究中實際應用的經驗，如果是與受訪者進行初次的方格法訪談，加上環境設定與方法介紹練習時間，15個元素絕對會超過兩小時的工作上限。

第二個限制15個元素以內的原因，是因為研究者所使用的分析軟體，只限於15*15的分析限制。這關乎的是研究成本的問題，完整版的軟體固然可以取得，但是所費頗高。對研究者而言，此一方格法研究的目的，是作為訪談研究的輔助與探索工具，透過方格法這一研究工具，能找出訪談工作所不容易找出的索引編製者內在不容易覺察的知識構念。並非以方格法為最主要的研究分析、解釋與檢驗工具。因此並無必要將有限的成本投入更複雜的方格法分析軟體上。

(效度原則)
方格法是一種研究工具。前述方格法概述一節，已經介紹過這種研究工具隱含的效度上的風險。以下將討論本研究中對於這些效度風險的處理方式。
- 代表涵蓋性(Representative coverage)：Beail(1985)認為元素應該能代表被研究的問題領域。在此要求下，有兩種代表性需要注意：
  - 理論代表性：取出的元素必須與研究問題有理論上的關聯。研究者在研究設計時，必須先行說明此理論抽樣上的邏輯關係。在此方格法探究中，都希望透過實際上的主題款目編製經驗，了解索引編製者的主題款目索引編製行為。因此每一項元素，都代表著索引編製者「一次實際發生過的索引主題款目編製行為」的經驗。而透過這些經驗，研究者以方格法找出這些經驗背後的認知構念結構，從而得到索引編製者心中的索引編製知識。
  - 參與者代表性：方格法的元素必須是受訪者經驗中具體存在的事物。因為方格法要引出的是受訪者本身具有的經驗知識。因此所有的本研究的方格法取樣，都是以個案中實際處理過的書後索引款目與頁面關係。
- 同質性(Homogenous)：同質性強調這些樣本之間都是屬於相同的類別，因此，樣本間的比較與分析才會有意義。本研究的同質性保證，在於前一階段的「具體詞彙與概念詞彙」的區分工作。
- 研究中，效度議題的檢討：有些個案(個案一)因為索引編製離訪談時間較久的關係，實際經驗已經變成一種印象中的經驗，沒有辦法具體的指出主題分析的行為差異。研究者有觀察到兩種行為，可以作為此一類型訪談的徵象：一種是同一個元素款目，會出現前後說法不一致的現象；另一是，索引編製者會跳回由「讀者」的角度來解釋索引款目的編製工作。在缺乏足夠代表性樣本的實際情況下，研究者只能先接受這些研究誤差，並且將此一方格法訪談結果，解釋為索引編製者「實際經驗」與「想像中一次典型索引編製行為」的混合型產物。這種經驗與想像的混合型結果，即使在訪談一個月之內的索引編製經驗中，也不能完全避免。研究者在訪談中，使用兩種方法來減少訪談工作中的想像誤差。一是，在前後不一致的項目中，追問索引編製者真確的現況，提供相關的文本與索引線索，看是否能夠刺激出受訪者的記憶；二是，發現受訪對象的認知身分角色已經「跑掉」，變成以「讀者」角度解釋自己的編製行為時，適度的繼續追問編製行為的線索，試圖讓受訪者重新扮演回原本編製者的角色。
信度原則：(取樣演算公式的建構)。對於抽樣架構中，樣本數量較多的個案，研究者透過一定的抽樣方法，以取得抽樣工作本身的信度。
- 注重一致性的演算
- 注重差異性的演算
- 兩種元素取樣的演算前測

個案一

索引款目抽樣：根據研究個案中，書後索引款目的概念詞款目，進行二階段分層抽樣。第一階段以系統抽樣，抽出30%概念款目；第二階段根據此30%款目，研究者進行Card Sorting進行差異抽樣，找出10-15組不同類型的款目。

根據前階段的款目區分結果，在本個案中，一共取得540條概念索引款目。

第一次兩階段抽樣：第一階段進行間隔抽樣。雖然間隔抽樣與隨機抽樣都是可以採用的系統抽樣法，但是決定使用間隔抽樣的原因有三：(1)用紙跟筆就可以進行，比較方便；(2)可以向受訪的編製者證明，這些被抽出來的款目不是研究者故意找碴的，而是有系統客觀進行的；(3)原本書後索引已經是以筆劃或是字母順序重新排列過，在內文編排的頁碼上已經是隨機混雜的，因此在索引中進行間隔抽樣，款目間發生過度集中的機率並不高。間隔抽樣數量為30%的款目，此數量在大部分系統抽樣中，在3000樣本下的小樣本是可以被接受的比例，故從之。第二階段進行差異抽樣。所有30%的款目，由研究者進行card sorting，預計分類出10-15組不同類型的概念款目。在這10-15類型中，各自隨機抽出一個實例作為該概念款目類型的代表。這540條款目，經研究者根據款目詞彙的詞性，區分為11類。以詞性來區分的原因有二，一為詞性的分類較為客觀，不涉及索引編製者的知識，研究者可以獨立進行；二為經過分類統計之後，在詞性上可以保持30%系統抽樣之後，樣本在詞性上有樣本母群的代表性。這11類分別為：(1)一般通用的可數名詞、(2)特定學科領域的可數名詞、(3)有形容詞修飾的可數名詞、(4)組合兩個可數名詞的複合詞、(5)一般通用的不可數名詞、(6)特定學科領域的可數名詞、(7)由形容詞而來的不可數名詞、(8)成句型態的款目、(9)以形容詞修飾的不可數名詞、(10)組合兩個不可數名詞的複合詞、(11)組合兩個不可數且以形容詞修飾的不可數名詞。一般而言，名詞有四類：專有名詞(proper nouns)、通用名詞(common nouns)、抽象名詞(abstract nouns)、集合名詞(collective nouns)。研究者將已篩選過專名(proper nouns)後之款目，根據其詞性分類。首先辨識出不可數名詞款目，包含抽象詞與集合詞都屬於此類；與可數名詞款目；以及較模糊不易判斷的款目。有些款目，中英文因為翻譯的關係，不容易分辨出兩者是相同的詞類。如「數位儲存(Digital Stores)」，根據英文是一可數的集合名詞[c]，但中文似是一不可數的概念詞[u]；回溯內文脈絡，可知此詞是指數位儲存系統的集合，當屬於集合名詞，但中文怎麼看也是一個概念詞，因為中文的「概念-集合」之間的區別並不明顯，有時兩者語義上互相轉換也都可以理解。因此，集合與概念此兩類詞類都會是抽樣的範圍之內。以下詳述各類分類的項目與內涵：

[u]: 不可數的款目。包括不可數的單詞，與約定俗成的雙詞，如「新興市場」。
[u.domain]: 一些學科內常用的專有詞彙，如Content Analysis、Digital Library等。雖然也有形容詞加以修飾，但已被學科內視為一般性的用法，因此將此類詞彙排除在經修飾限定的詞彙之外，但只限於適用在特定學科領域。因此表記為[u.domain]。
[u_adj]: 英文有些詞類是形容詞的形式[u_adj]，。如「Educational」，回溯內文脈絡，可知這裡完整的指涉是「教育方面的需求」，是一個經修飾限定的概念詞款目。因此，此類詞與有形容詞修飾的通用名詞，是相同的。
[u+adj]: 某些通名根據形容詞或形容詞子句修飾過後[u+adj]，更具專指性，但仍非專名。如「Library without wall」。根據抽樣原則，只排除專名，因此此種形式會是抽樣的範圍之內。
- 大部分四字的中文款目，幾乎都可以拆解為「修飾限定詞+n」的形式，這些款目如果已經被視為是約定俗成的詞彙時，表記為[u]。但，如果是多個名詞累積的中文款目，如「中國圖書館事業」，可拆解為「中國圖書館+事業」，或「中國+圖書館事業」，都屬於透過修飾限定詞修飾通用不可數概念，因此表記為[u+ adj]。
- 大部分其後有”性”、”度”、”化”、”式”、”型”、”學”、”主義”的中文款目概念，在英文中通常利用詞尾變化來達成者，直接表記為[u]。但是不與上一條可拆解為「adj+noun」形式的原則牴觸。如「中文圖書資料自動化」，仍表記為[u+adj]
- 部分中文款目中有動詞者，將動詞視為動作名詞，前方視為修飾限定詞，因此表記為[u+adj]。一般正確的形式是「n+v」或「adj+v」，如「中美資料交流」。
[u_sentence]: 許多超長詞彙，可以視為有複雜的命題結構，如具有兩級以上的概念命題，視為句子或子句的形式[u_sentence]
[u+and]: 詞彙以”and”, “和”、”與”、”及”等連接詞連接的，表記加上[+and]
- 中文款目中附有英文註解，但若中文與英文註解詞性不同，以中文為主。如「一組組顯示格式(grouped record display)」，中文是[u_sentence]，英文是[u+adj]
[c]: 可數的款目。包括可數的單詞，與中文的集合名詞。雖然此處是可數名詞，但是大部分的普通名詞並不會列為索引款目，而通常是指一特別規格的物品，乃至於其集合。因此在索引款目中的可數名詞，需要判斷的是：這是指一物品集合(collective nouns)，或是指該特殊物品背後的專有格式？如是一專有格式，在本判準中將視為一「專名(proper name)/具體款目」，而加以排除抽樣之中。如果提及該物品是拿來「使用/利用」的，視為一個集合概念。即，要麻就是格式專名，要麻就是集合名詞。
[c+adj]: 某些詞經過形容詞或形容詞子句，加以修飾限制的集合名詞。此名詞是由修飾限制所限定，而非具體物。
[c.domain]: 在某些學科領域裡面，常被使用的集合名詞。此集合名詞在學科內有約定俗成的具體效果，但本質上並非具體的物品，可是唯一有分類效果的概念集合。如「OPAC」是Online Public Acess Catalog之縮寫，而OPAC是一個具體資訊系統的分類，只要符合某些判準條件，一個資訊系統就可以被視為一OPAC系統。
- 延伸此一判準，大部分「xx系統」的款目，都是指一系統概念的集合，而非具體系統。具體系統會有一明確的規範，如「DDC」、「LC」、「MARC」等，皆有具體規範可查者，屬專名。無具體規範可查者，視為一集合概念。
- [c+and]: 詞彙以”and”, “和”、”與”、”及”等連接詞連接的，表記加上[+and]

其款目數與比例見附表(插入附表)。

分析與檢討：根據第一階段的抽樣工作結果，自行以方格法進行前導測試。但是結果發現，明顯看出有三種到四種的行為樣式：
1. (1)由主詞抽出；
2. (2)由條列項目中抽出；
3. (3)既有領域專有詞彙；
4. (4)因為該詞附有英文原文對照而選出。

因為此抽樣的結果非常明顯，這些類型在研究者的進行款目的內容分析過程中，也不斷浮現，研究者認為這樣的結果可能不需要再經由索引編製者再重複一次。這個結果也許符合整體上索引編製行為的比例，但是考慮到其他的可能性：是否有其他的行為類型，研究者並沒有找出來？因此研究者進行第二次的兩階段抽樣。

第二次的兩階段抽樣：第二次的兩階段抽樣，等於是進行另一次的抽樣測驗。看是否再另一種抽樣策略下，是否會得到不同的結果。根據第一次兩階段抽樣的結果，研究者假設特殊的詞性可能與特殊的編製行為有關，因此在30%的抽樣比例分配中，各類至少都有一個以上的樣本被選取。經過分層隨機抽樣，一共取得11類162款目。此162條款目，再由研究者根據此款目在文本中的關係，進行更詳細的款目內容分析：

款目與頁碼關係，就概念可能性上，有以下72種組合(3x3x4x2)：

	涵蓋一具體字詞[t]	涵蓋一或數個段落[p]	涵蓋一或數個具體章節[s]
由內文字詞[a]	11	13	17
由條列項目[b]	19	23	29
由標題[c]	31	37	41

款目的位置：
- 為受詞[.obj]
- 為主詞[.sub]
- 為獨立詞項[.iso]
- 為難辨的詞項[.cpx]：修飾某些概念、形容詞、命題的限定條件，等。
為附有英文原文對照[.eng]

在這些複雜的內容分析之後，第一個結果是整體的款目比例。顯示(analysis 1)款目的分布上，有很明顯的集中趨勢。這些集中的趨勢，與第一次的取樣結果是有關的，因為大部分的樣本會在第一次的抽樣中會被分析，但是較特殊的樣本並不一並會被分析到，尤其是方格法的抽樣只限制在15項元素的情況下。因此，第二階段的抽樣分析，主要在探究是否還有其他索引編製行為的可能的方向下進行。

研究者計算各種分類組合的次數與比例，找出差異程度最大，並且仍然有相當款目樣本數量的例子，取出前十五項作為第二次二階段元素抽樣的抽樣規則。這中間經過了許多「試誤」的過程。不同的演算的規則，會計算出不同的抽樣比例結果。最終研究者使用兩種不同的代表性演算公式，隨機取出兩組元素樣本。由研究者與另一位同學，進行方格法測試。結果符合兩種演算法本身的差異：甲式的方格法結果集中性較強，但是仍然較第一次二階段抽樣的結果較分散，乙式則最為分散。(描述公式)(抽樣表格analysis5.2)(抽樣結果)

由於第二次二階段抽樣的目的，是在以另一個角度，找出是否還有其他的索引編製可能策略，因此研究者選擇以乙式演算法所作出的二階段抽樣結果，作為索引編製者進行方格法訪談的元素。

抽樣完成後，研究者製作概念款目類型代表卡片。此卡片呈現該索引款目的在書後索引的上下文，與原頁數。研究者需要試圖還原該索引款目指回的原頁數的劃記原貌。

Table of Contents