Citation - 林頌堅. (2003). 基於詞語抽取的圖書與資訊學刊研究主題分析. 圖書與資訊學刊(47), 15-35.
Keyword - domain_analysis, keyword_extraction, latend_semantic_indexing
Tag - domain analysis, latend semantic indexing, journal article, clustering analysis
基於詞語抽取的圖書與資訊學刊研究主題分析
領域分析
領域分析(domain analysis):以了解某一學科內,普遍的研究主題與知識架構。使研究人員了解學科發展的現況。
文獻主題辨識
概念抽取
- 對期刊文獻的中英文摘要進行關鍵字抽詞
- 對抽詞結果以隱含語義索引(latend semantic indexing)進行詞語間的相關程度統計
- 對抽詞相關結果以Cliques叢集演算法,進行叢集分析(clustering analysis),形成概念集合。一個概念集合可以視為集合中各個語詞特徵的總和
- 可以透過隱含語義索引,由概念集合指引至相關文獻
對核心概念的判斷準則
- 目的:找出最明顯重要的概念,作為主題。
- 核心概念集合:與其他概念集合相關的程度。與越多的概念相關,則此概念集合越可能是重要的研究主題。
- 對核心概念集合進行Ward叢集分析,找出研究主題。
由研究主題回溯與主題相關的論文
- 因為:研究主題的特徵視為概念集合特徵的總和
- 可以透過隱含語義索引,由概念集合總和指引至相關文獻
- 對主題內的相關文獻進行作者與發表時間的描述統計
主題關係的視覺化呈現
- 以叢集分析與多維量尺法(multi-dimensioanl scaling)呈現主題間的「共文獻關係」,以呈現主題間的相關程度。
related references
- Hjorland, B., & Albrechtsen, H. (1995). Toward a new horizon in information science: Domain-analysis. Journal of the American Society for Information Science, 46(6), 400-425.
- Deerwester, S., Dumais, S., Landauer, T., Furnas, G., & Harshman, R. (1990). Indexing by latent semantic analysis. Journal of the American Society of Information Science, 41(6), 407.