研究者在閱讀文獻與理論的時候,像是兩面刃一樣。一方面怕重複既有研究;另一方面又怕受到他人研究結論的影響,或是有研究方法更嚴重的說,污染。我今天拿到一本可能是相關研究的著作,剛剛出版的,所以之前的文獻探討沒有能看到;而我研究已經進行了一部份,要不要看?
因此,我設想出一種類似科技研發領域中 Clean Room 的方法:找指導老師或是其他了解自己研究的學者或研究夥伴看,然後由他們比較這個研究問題與方法過程,中間是否有重複或雷同的部分;但是一定不能透漏任何研究結果。因為即便是一樣的研究問題,不同的研究方法與不同的樣本,也可能得出不同的結論,研究本身還是有一定的意義與價值。但是過早知道相關研究的結論,難免對研究者在作判斷的時候,會有一些心智上的影響。
以下只說明 Repertory Grid 部分:
詞類 | 款目數量 | 佔比 | 抽樣數量 | |
---|---|---|---|---|
[c] | 47 | 8.70% | 14 | |
[c.domain] | 69 | 12.78% | 21 | |
[c+adj] | 44 | 8.15% | 13 | |
[c+and] | 2 | 0.37% | 1 | |
[u] | 133 | 24.63% | 39 | |
[u.domain] | 94 | 17.41% | 28 | |
[u_adj] | 6 | 1.11% | 2 | |
[u_sentence] | 12 | 2.22% | 4 | |
[u+adj] | 115 | 21.30% | 34 | |
[u+and] | 15 | 2.78% | 5 | |
[u+adj+and] | 3 | 0.56% | 1 | |
SUM | 541 | 100.00% | 162 | |
Threshold value: 157 | 抽樣數量以Excel ceiling()函數計算 |
由於分析第一次抽出結果(15項款目,已廢棄),發現四種主要樣式:(1)由主詞抽出;(2)由條列項目中抽出;(3)既有領域專有詞彙;(4)因為該詞附有英文原文對照而選出。懷疑是否還有其他行為樣式,因此決定擴大到30%樣本比例,重新分析。為了讓excel跑出亂數表,花了幾個小時,結果還是沒有辦法自動亂數抽樣出款目,只好手工一個個由亂數表抽樣。
亂數以Excel Randbetween()函數產生 <csv :data:attic:research:bob-indexing:randen_20060829.csv></csv>
詞類 | 位置 | 款目 | 上位款目 | 頁碼 |
---|---|---|---|---|
u | 394.1 | Adaptability | 27 | |
u+adj | 395.2 | Computer Assistend Reference Services | 59 | |
u | 395.2 | Cyberian | 193 | |
u_adj | 396.1 | Educational | 129 | |
u+adj+and | 404.1 | 公務人員保障及培訓 | 223-224 | |
u_sentence | 404.1 | 分析和整理資料的知識 | 40 | |
u+and | 405.2 | 外匯與投資 | 286 | |
u+adj | 406.1 | 全文處理(Text Processing)技術 | 104 | |
c | 408.1 | 自動化館際互借系統 | 76 | |
c+adj | 410.2 | 青少年兒童讀物 | 138 | |
c.domain | 411.2 | 電腦線上目錄(OPAC) | 查檢資料方式 | 332 |
c.domain | 413.2 | 書目中心 | 51 | |
u.domain | 424.1 | 閱覽性資料 | 330 | |
c+and | 424.1 | 學術性及大專圖書館 | 328 | |
u.domain | 426.1 | 讀者服務 | 28, 51, 53-54, 59, 64, 78, 153, 189, 203, 206, 322, 329, 333 |
涵蓋一具體字詞[t] | 涵蓋一或數個段落[p] | 涵蓋一或數個具體章節[s] | |
由內文字詞[a] | 11 | 13 | 17 |
由條列項目[b] | 19 | 23 | 29 |
由標題[c] | 31 | 37 | 41 |