Metadata
Metadata
/ 有著種種翻譯法,如後設資料、中介資料、詮釋資料、元資料 等。
定義
最簡單的定義是:關於資料的資料。(data about data)。通常會舉圖書館的書目資料作為例子;書目資料是關於書的資料,而書是資料本身,因此書目資料是一種代表書/資料的 詮釋資料(metadata)。其他一些常見的詮釋資料像是描述資料的來源或作者,其取用方式與限制等。
依據Jane Greenberg (2002) 的定義,Metadata是: “structured data about an object that supports functions associated with the designated object.” 即「metadata 是為了支援特定物件的功能性,的關於物件之結構化資料」
此處定義有三項概念定義,一為結構化資料 (structured data),二為物件 (object),三為功能性 (function)。
Coyle(2005)認為 metadata 符合三個必要的特性:
- metadata 是人為建構的資訊:例如人類利用經緯度來描述某個特定的地理位置,但是實際上觀察自然地理環境,並不會有一條條畫好的線存在。雖然經緯度的資訊是人為所建構的,但是透過經緯度的資訊,人類可以準確的說明與標定特定的場所與位置。
- metadata 是為了人類某個目的或功能而發展的資訊:如不同目的的地圖,會在設計與繪製的時候著重不同的資訊與不同的組織要素。沒有一種地圖是可以滿足所有不同目的的,同樣也沒有一種 metadata 適用所有不同資訊標的。這是因為 metadata 並不是取決於資訊標的(object)自身,而是取決於其人類設計時的需求與原本的目的。metadata 並不是真實的世界本身,而是在某個時刻與目的當下,所觀看世界的角度。
- metadata 是真正事物的替代物(surrogate):圖書館的編目資料就是真實書架上的書的替代物。metadata所扮演的替代物角色,成為數位環境中的關鍵;因為數位環境中有許多不易瀏覽與不易取出的資訊,因此 metadata 成為組織與取用數位資源的一種重要角色。
Coyle 觀點中,我認為前兩點值得商榷:(1)例子中,地圖或經緯度,該是屬於data或是metadata?如果說真實世界是第一自然,而針對真實世界的描述是第二自然,那針對描述的再描述,也就是metadata,便是第三自然。地圖與經緯度從這樣來看都是data,人為的第一手資料。當然,這些資料也都符合 Coyle 認為的特徵,即人為建構,與有特定目的性。 而metadata,作為「關於資料的資料」,也當然具備了資料的特性,這是無庸置疑的。
藍文欽(2003)認為引用Greenberg (2002) 對 metadata定義:一組結構化的元件或項目(structured data elemnets),並且從其用途的方面,認為metadata是用於描述物件(Object),作為該物件之representation或 surrogate,並配合其他機制將物件組織成一套系統。
metadata的目的
- 組織資訊的目的是為了檢索(retrieval)資訊。這是一般通用的教科書說法。
- 如果檢視metadata分類的類型,以Gilliland-Swetland (2000)分的五類,事實上也代表了metadata需要滿足的目的性也不僅僅只有資訊檢索而已。
- 也許可以在由資訊檢索在上一層的概念;為了資訊使用(use)的目的,而發展出metadata。
Metadata的種類
wikipedia(2005)
- Data warehouse metadata : 說明資料儲存結構相關資訊的資料。
- File system metadata : 說明檔案系統架構的資料與檔案屬性的資料。
- Program metadata : 應用程式內的資料,包含向作業系統描述程式運作所需的相關資訊。
Gilliland-Swetland (2000)
將metadata分為五種類型:
- Administrative metadata : 管理詮釋資料
- Descriptive metadata : 描述詮釋資料
- Preservation metadata : 保存詮釋資料
- Technical metadata : 技術性詮釋資料
- Use metadata : 使用詮釋資料
Metadata 的功能
Dempsey & Heery (1997)從使用者的觀點,認為 metadata 具有五項功能: (1) Location: 定位資訊 (2) Discovery: 揭露資訊 (3) Documentation: 描述紀錄資訊 (4) Evaluation: 評估資訊 (5) Selection: 選擇資訊
Metadata 與編目
Greenberg, J. (2002)認為metadata與圖書館編目工作的相同點在於,兩者都是為了使容易發現資訊與其他功能性目的,而產生的一組結構化的描述資料。
相異之處,在於metadata一方面使用了新的網路技術,如新的編碼語言(XML)等,另一方面metadata利用的情境並不只限於對圖書館內資源的描述的情境,而更發展了各種其他用途與應用。因此,metadata比起圖書館編目,更加強調標準化(standardization)與互通性(interoperability),而更能應用到不同的領域。
Metadata 的要素
- 項目(含其名稱及著錄內容)- Semantic
- 呈現方式(含其結構與次序)- Structure
- 敘述的語法 - Syntax
Metadata 的限制
metadata是人類為了某種目的,而建構出來的內容。因此,metadata的內容需要符合其預設的目的性,而且是明確的目的性。Gilliland-Swetland (2000)所區分的五類metadata形式,基本上說明了五種不同目的的分野。然而,這也只是一個比較大範圍的區分,建構metadata時,需要更具體的功用情境。
因此,在為了資料輸入成本與資料儲存成本的考量下,metadata可能需要在最經濟的情況下,紀錄合乎目的性的資料,才能讓整個資訊系統有效的運作。
藍文欽(2004)也針對描述性詮釋資料所無法做到的事情,發展了六個「無力論」:
- 描述性後設資料得維持精簡的形式(compact or concise format) ,故無法包括物件的所有屬性或面向。
- 描述性後設資料以提供與物件有關的事實性描述為主,至於這些描述對讀者代表何種意義,則非描述性後設資料提供者所能充分掌握或預期。
- 以文字為主(text-based) 的描述性後設資料,無法充分呈現物件的某些特性,如:圖像、表格、聲音、影像等。
- 描述性後設資料中所提供的項目,有些可能是不常用或罕用,使用者常用的項目多集中在少數幾項。使用者在運用這些項目時,不一定會依循後設資料提供者所安排的順序,而是有自己的瀏覽模式或順序。
- 不同使用者對描述性後設資料的需求可能不同,不同的資料類型亦需要不同的資料項目,亦即一套劃一的描述性後設資料是無法滿足多樣化的需求。
- 描述性後設資料通常是以物件全體作為描述的對象,但資訊求者有興趣的,卻可能是物件中的某部分,是後設資料所不提供的。
Metadata on the WWW
Gill, T.(2000)認為,通行在網際網路上的metadata標準有三種,即 (1)在HTML中的meta tag 如“keyword”、“description” (2)Dublin Core Metadata Initiative (3)Resource Description Framework (RDF).
HTML中的meta tag 如“keyword”、“description” 之所以會有效用,是因為搜尋引擎如 AltaVista 會依賴這類資訊來決定網頁資源與使用者檢索之間的主題相關性,藉以建立檢索排序。這可以說是由作者自行提供主題分析內容,讓資訊檢索系統由此主題分析資訊,來與使用者經由自然語言與切截等檢索語言所表徵的資訊需求資訊,加以比對與排序。不過目前大部分的搜尋引擎已經減少或中止使用HTML中的meta tag來作為相關性判斷的依據,因為網路上出現過多的 Meta tag spamming ,降低整體的資訊相關程度的正確性。
DC (Dublin Core) 用 15個不同的元素欄位來描述一個資訊資源。
Semantic and Metadata
microformat
references
- Coyle, K. (2005). Understanding metadata and its purpose. /Journal of Academic Librarianship/, 31(2), 160.
- Galnares, R. (1999). Metadata in the World Wide Web http://www.cs.njit.edu/~galnares/Metadata.html
- Gilliland-Swetland, A. J. (2000). Setting the state. In M. Baca (Ed.), Introduction to metadata: Pathways to digital informaiton. Los Angeles, CA: Getty Information Institute.
- Greenberg, J. (2002). “Metadata and the World Wide Web” Encyclopedia of Library and Information Science, V.72, p. 245.
- Gill, T. (2000). Metadata and the World Wide Web. In M. Baca (Ed.), Introduction to metadata: Pathways to digital informaiton. Los Angeles, CA: Getty Information Institute.
- 藍文欽. (2004). 描述性後設資料之「無力論」. In 王振鵠教授八秩榮慶籌備小組 (Ed.), 王振鵠教授八秩榮慶論文集 (pp. 273-282). 台北: 學生書局.
- 藍文欽. (2003). 知識組織工具(一) metadata. 2005, from http://ceiba3.cc.ntu.edu.tw/course/cb9879/92.04.24.ppt