研究設計簡介
訪談
索引款目內容分析:
方格法訪談進行
方格法訪談分析
研究設計簡介
訪談
款目內容分析
原則
款目區分
在初步的索引編製訪談與內容分析之後,研究者發現,在索引編製者的工作中,概念與非概念詞彙的辨識過程有很大的不同。此一論點可視為第一階段研究的發現。
(相關研究資料討論,或要參考其他章節)
因此,後續的研究中,研究者集中在概念詞彙的索引編製工作上。此一工作的進行,第一步需要找出索引編製者的概念款目編製行為,再透過資料收集以對這些行為進行研究。此處首先討論具體款目與概念款目的區分判斷:
具體款目與概念款目
這一區分是在研究中逐步發展出來的。透過數次前測工作,研究者規劃出一具體款目與概念款目的判準,並依此作為後續個案款目內容分析的依據。
(理論上的討論,或參考其他章節)
此一判準的建構,大致上經過三次的前測。第一次前測,研究者使用個案一的款目,以便利取樣的方式,根據三位同學或學妹,以口頭方式告知區分的方法,請每一位參與者各區分兩頁的索引款目。前測進行中,請參與者對於模糊或是搞不清楚的地方,直接問研究者,研究者再把這些問題與區分方法紀錄下來,建立第一版的區分判準。第二次前測,研究者以便利取樣方式,找到六位學弟妹作參與者,以分工方式,將所有個案一的索引款目全部區分完畢。如果有不確定或是有疑問的部分,在款目前面畫圈註記。研究者也在旁邊,如果有問題的話,也直接與參與者討論。然後研究再根據第二次前測的問題,修改成為第二版的區分判準。再請另外兩位同學,各以一杯珍珠奶茶的代價,根據第二版區分判準,進行第三次區分前測。
第二版區分判準 (具體款目與概念款目區分判準說明_20060822.doc)
實際操作程序
個案一
鼎鍾文集的款目內容分析
問題與理論依據:建立具體款目與概念款目的區分
(研究情境描述)
(建立區分準則)
(款目區分前測的執行)
(款目區分前測分析)
(款目區分的結果)
根據第二版判準測試,兩位參與者,加上研究者自己的區分結果,在扣除專名後的概念詞完全一致的款目共有477條,達所有至少被一個人認定為概念款目的數量的 88.33%。而與使用第一版的前測一致性比例為高。因此研究者認為這樣的款目區分判準具有一定的一致性。研究者在針對至少被一個人以上認定為概念的款目,與內文進行檢查,排除掉因為語義不清辨識錯誤的款目,一共取得540條概念款目。
個案二
台灣文學年鑑(2005)的款目內容分析
因為索引編製者,已經作過完整的款目分類工作。根據索引編製者的款目分類原則說明,研究者將原編製者所分出的「人名類」、「書報刊名類」、「會議名稱類」、「機關類」、「學校名稱類」、「文學獎類」、「文學營類」、「論文名稱類」歸類餘具體款目。再進一步檢查餘下的兩種款目類型:「主題類」與「其他類」。
需要進一步檢查,原因有二:(1)「其他類」款目要需要進一步區分具體與概念款目;(2)即使是編製者分在「主題類」的款目,也不一定全部都是研究者所認定的概念款目。
實際檢查的結果,在總共7137條款目中,只有29條是屬於概念詞彙。比例遠低於鼎鍾文集個案。索引編製者進行了完整的款目分析工作。在編製者的規劃中,將款目分為:1.人名、2.書報刊、3.主題、4.會議名稱、5.機關、6.學校名稱、7.文學獎名稱、8.文學營、9.其他、t.論文名稱,共十項。根據訪談,這十項的區分與內涵,並非依開始就有規劃完整的,而是在編製過程中,逐步補充完成的。其中1.2.4.5.6.7.項目是較沒有疑問的;這些項目,一方面是索引常見項目,在以往的台灣文學年鑑索引中,也是既有的項目。
根據索引編製者原始劃記為「主題類」的款目22筆中,研究者進一步分析其款目內涵,發現其中不完全是「主題類」款目,其中尚有混雜部份的機構名稱(一陽農場)、網站名稱(手機文學館)、專欄名稱(跨界之旅)與法令名稱(政府採購法、台灣省戒嚴期間新聞雜誌圖書管制辦法)的款目。綜觀所有的款目劃記,大部份專欄名稱與網站名稱都是以「書報刊名」類別劃記,但是在一開始,編製者並沒有意識到這個類型的區分,由編製者並沒有在預先規劃的劃記類型文件中描述這兩類款目可以得到證明,因此導致錯誤分為主題類。對本個案的索引編制工作而言,這類的分類錯誤實際上並不會影響到索引編製的結果,因為最終的索引並沒有呈現出這些款目類型的資訊。法令名稱是個特例,研究者認為法令名稱應屬於具體詞彙,而非概念詞彙。當然,這點並非絕對的判斷標準,這與著作的主題與論述類型有關;一本國際智財權法的專書中,提及「著作權法」的時候,可能不是指特定的某部法令規範,而是一整個著作權法的概念;因此還必須考量行文的上下脈絡才能加以判斷。但是在此的兩筆法令款目,皆指國內特定具體的法令;即便法令仍然有可能會修改變動,但是配合著作內文脈絡觀之,應該具有相當的專指性。機構名稱(一陽農場)在原文中以引號加強,但是並不是很清楚是一個教育機構、一個佔有實際空間的場定、或是一個社會運動項目,但是還是比較傾向機構名稱。扣除掉以上項目,剩下的主題類款目區分有以下幾類:(1)文學概念:女性主義、古典文學、同志文學等,共7筆;(2)事件概念:二二八事件(二二八)、芝山巖事件、鄉土文學論戰、「溫羅汀」串連行動;(3)普通專有名詞:BLOG、部落格;(4)特定專稱:生活促進隊、和平宣言;(5)其他(通用詞彙):架構(Framework)、綜述。
不屬於文學營的展覽與活動名稱,以及無法分入以上九類的款目,被索引編製者區分為「其他類」。研究者分析此類95筆款目,扣除部分應是分類錯誤的款目(如,是網站名稱、機構名稱、系統名稱),餘下的項目中(89筆),活動展覽佔73%(65筆),其次是計畫名稱,佔13.48%(12筆),這兩項加總即達86.5%。而其餘的項目筆數均不多,且與主題的區分類似,研究者將這些款目分類如下:(1)通用詞彙;(2)普通專有名詞;(3)特定專稱;(4)特定政策專稱;(5) 概念 (大河小說、文化創意產業);(6)論題主題。
研究這兩類款目的劃記,可以對於索引編製者如何建立或是標示出一個特定概念詞彙,有一理解。
方格法元素抽樣與取出
經過款目內容分析的區分工作之後,下一部要以這些概念款目,作為方格法訪談工作中所使用的元素樣本抽樣架構。在這一個階段的抽樣中,將抽出10~15個元素樣本,作為方格法訪談的元素。將元素數量定為15個,有兩個主要的原因:
第一個是訪談的時間上限。根據Easterby-Smith(1980)對方格法訪談進行的經驗,他認為10*10的方格設計,大約需要兩個小時才能完成。這接近一般訪談工作的上限。方格法訪談的時間,除了訪談的元素與構念數量之外,訪談的風格形式也是另一種考量的因素。如果訪談包含元素與構念的引出,甚至需要使用階梯法(ladding),探尋受訪者構念與構念間的關係,會比純粹計量研究的方格法更花時間。根據研究者在此研究中實際應用的經驗,如果是與受訪者進行初次的方格法訪談,加上環境設定與方法介紹練習時間,15個元素絕對會超過兩小時的工作上限。
第二個限制15個元素以內的原因,是因為研究者所使用的分析軟體,只限於15*15的分析限制。這關乎的是研究成本的問題,完整版的軟體固然可以取得,但是所費頗高。對研究者而言,此一方格法研究的目的,是作為訪談研究的輔助與探索工具,透過方格法這一研究工具,能找出訪談工作所不容易找出的索引編製者內在不容易覺察的知識構念。並非以方格法為最主要的研究分析、解釋與檢驗工具。因此並無必要將有限的成本投入更複雜的方格法分析軟體上。
個案一
索引款目抽樣:根據研究個案中,書後索引款目的概念詞款目,進行二階段分層抽樣。第一階段以系統抽樣,抽出30%概念款目;第二階段根據此30%款目,研究者進行Card Sorting進行差異抽樣,找出10-15組不同類型的款目。
[u]: 不可數的款目。包括不可數的單詞,與約定俗成的雙詞,如「新興市場」。
[u.domain]: 一些學科內常用的專有詞彙,如Content Analysis、Digital Library等。雖然也有形容詞加以修飾,但已被學科內視為一般性的用法,因此將此類詞彙排除在經修飾限定的詞彙之外,但只限於適用在特定學科領域。因此表記為[u.domain]。
[u_adj]: 英文有些詞類是形容詞的形式[u_adj],。如「Educational」,回溯內文脈絡,可知這裡完整的指涉是「教育方面的需求」,是一個經修飾限定的概念詞款目。因此,此類詞與有形容詞修飾的通用名詞,是相同的。
[u+adj]: 某些通名根據形容詞或形容詞子句修飾過後[u+adj],更具專指性,但仍非專名。如「Library without wall」。根據抽樣原則,只排除專名,因此此種形式會是抽樣的範圍之內。
大部分四字的中文款目,幾乎都可以拆解為「修飾限定詞+n」的形式,這些款目如果已經被視為是約定俗成的詞彙時,表記為[u]。但,如果是多個名詞累積的中文款目,如「中國圖書館事業」,可拆解為「中國圖書館+事業」,或「中國+圖書館事業」,都屬於透過修飾限定詞修飾通用不可數概念,因此表記為[u+ adj]。
大部分其後有”性”、”度”、”化”、”式”、”型”、”學”、”主義”的中文款目概念,在英文中通常利用詞尾變化來達成者,直接表記為[u]。但是不與上一條可拆解為「adj+noun」形式的原則牴觸。如「中文圖書資料自動化」,仍表記為[u+adj]
部分中文款目中有動詞者,將動詞視為動作名詞,前方視為修飾限定詞,因此表記為[u+adj]。一般正確的形式是「n+v」或「adj+v」,如「中美資料交流」。
[u_sentence]: 許多超長詞彙,可以視為有複雜的命題結構,如具有兩級以上的概念命題,視為句子或子句的形式[u_sentence]
[u+and]: 詞彙以”and”, “和”、”與”、”及”等連接詞連接的,表記加上[+and]
[c]: 可數的款目。包括可數的單詞,與中文的集合名詞。雖然此處是可數名詞,但是大部分的普通名詞並不會列為索引款目,而通常是指一特別規格的物品,乃至於其集合。因此在索引款目中的可數名詞,需要判斷的是:這是指一物品集合(collective nouns),或是指該特殊物品背後的專有格式?如是一專有格式,在本判準中將視為一「專名(proper name)/具體款目」,而加以排除抽樣之中。如果提及該物品是拿來「使用/利用」的,視為一個集合概念。即,要麻就是格式專名,要麻就是集合名詞。
[c+adj]: 某些詞經過形容詞或形容詞子句,加以修飾限制的集合名詞。此名詞是由修飾限制所限定,而非具體物。
[c.domain]: 在某些學科領域裡面,常被使用的集合名詞。此集合名詞在學科內有約定俗成的具體效果,但本質上並非具體的物品,可是唯一有分類效果的概念集合。如「OPAC」是Online Public Acess Catalog之縮寫,而OPAC是一個具體資訊系統的分類,只要符合某些判準條件,一個資訊系統就可以被視為一OPAC系統。
延伸此一判準,大部分「xx系統」的款目,都是指一系統概念的集合,而非具體系統。具體系統會有一明確的規範,如「DDC」、「LC」、「MARC」等,皆有具體規範可查者,屬專名。無具體規範可查者,視為一集合概念。
[c+and]: 詞彙以”and”, “和”、”與”、”及”等連接詞連接的,表記加上[+and]
其款目數與比例見附表(插入附表)。
因為此抽樣的結果非常明顯,這些類型在研究者的進行款目的內容分析過程中,也不斷浮現,研究者認為這樣的結果可能不需要再經由索引編製者再重複一次。這個結果也許符合整體上索引編製行為的比例,但是考慮到其他的可能性:是否有其他的行為類型,研究者並沒有找出來?因此研究者進行第二次的兩階段抽樣。
款目與頁碼關係,就概念可能性上,有以下72種組合(3x3x4x2):
| 涵蓋一具體字詞[t] | 涵蓋一或數個段落[p] | 涵蓋一或數個具體章節[s] |
由內文字詞[a] | 11 | 13 | 17 |
由條列項目[b] | 19 | 23 | 29 |
由標題[c] | 31 | 37 | 41 |
在這些複雜的內容分析之後,第一個結果是整體的款目比例。顯示(analysis 1)款目的分布上,有很明顯的集中趨勢。這些集中的趨勢,與第一次的取樣結果是有關的,因為大部分的樣本會在第一次的抽樣中會被分析,但是較特殊的樣本並不一並會被分析到,尤其是方格法的抽樣只限制在15項元素的情況下。因此,第二階段的抽樣分析,主要在探究是否還有其他索引編製行為的可能的方向下進行。
研究者計算各種分類組合的次數與比例,找出差異程度最大,並且仍然有相當款目樣本數量的例子,取出前十五項作為第二次二階段元素抽樣的抽樣規則。這中間經過了許多「試誤」的過程。不同的演算的規則,會計算出不同的抽樣比例結果。最終研究者使用兩種不同的代表性演算公式,隨機取出兩組元素樣本。由研究者與另一位同學,進行方格法測試。結果符合兩種演算法本身的差異:甲式的方格法結果集中性較強,但是仍然較第一次二階段抽樣的結果較分散,乙式則最為分散。(描述公式)(抽樣表格analysis5.2)(抽樣結果)
由於第二次二階段抽樣的目的,是在以另一個角度,找出是否還有其他的索引編製可能策略,因此研究者選擇以乙式演算法所作出的二階段抽樣結果,作為索引編製者進行方格法訪談的元素。
抽樣完成後,研究者製作概念款目類型代表卡片。此卡片呈現該索引款目的在書後索引的上下文,與原頁數。研究者需要試圖還原該索引款目指回的原頁數的劃記原貌。
個案二
方格法訪談