Metadata
/ 有著種種翻譯法,如後設資料、中介資料、詮釋資料、元資料 等。
定義
最簡單的定義是:關於資料的資料。(data about data)。通常會舉圖書館的書目資料作為例子;書目資料是關於書的資料,而書是資料本身,因此書目資料是一種代表書/資料的 詮釋資料(metadata)。其他一些常見的詮釋資料像是描述資料的來源或作者,其取用方式與限制等。
依據Jane Greenberg (2002) 的定義,Metadata是: “structured data about an object that supports functions associated with the designated object.” 即「metadata 是為了支援特定物件的功能性,的關於物件之結構化資料」
此處定義有三項概念定義,一為結構化資料 (structured data),二為物件 (object),三為功能性 (function)。
Coyle(2005)認為 metadata 符合三個必要的特性:
metadata 是人為建構的資訊:例如人類利用經緯度來描述某個特定的地理位置,但是實際上觀察自然地理環境,並不會有一條條畫好的線存在。雖然經緯度的資訊是人為所建構的,但是透過經緯度的資訊,人類可以準確的說明與標定特定的場所與位置。
metadata 是為了人類某個目的或功能而發展的資訊:如不同目的的地圖,會在設計與繪製的時候著重不同的資訊與不同的組織要素。沒有一種地圖是可以滿足所有不同目的的,同樣也沒有一種 metadata 適用所有不同資訊標的。這是因為 metadata 並不是取決於資訊標的(object)自身,而是取決於其人類設計時的需求與原本的目的。metadata 並不是真實的世界本身,而是在某個時刻與目的當下,所觀看世界的角度。
metadata 是真正事物的替代物(surrogate):圖書館的編目資料就是真實書架上的書的替代物。metadata所扮演的替代物角色,成為數位環境中的關鍵;因為數位環境中有許多不易瀏覽與不易取出的資訊,因此 metadata 成為組織與取用數位資源的一種重要角色。
Coyle 觀點中,我認為前兩點值得商榷:(1)例子中,地圖或經緯度,該是屬於data或是metadata?如果說真實世界是第一自然,而針對真實世界的描述是第二自然,那針對描述的再描述,也就是metadata,便是第三自然。地圖與經緯度從這樣來看都是data,人為的第一手資料。當然,這些資料也都符合 Coyle 認為的特徵,即人為建構,與有特定目的性。 而metadata,作為「關於資料的資料」,也當然具備了資料的特性,這是無庸置疑的。
藍文欽(2003)認為引用Greenberg (2002) 對 metadata定義:一組結構化的元件或項目(structured data elemnets),並且從其用途的方面,認為metadata是用於描述物件(Object),作為該物件之representation或 surrogate,並配合其他機制將物件組織成一套系統。
組織資訊的目的是為了檢索(retrieval)資訊。這是一般通用的教科書說法。
如果檢視metadata分類的類型,以Gilliland-Swetland (2000)分的五類,事實上也代表了metadata需要滿足的目的性也不僅僅只有資訊檢索而已。
也許可以在由資訊檢索在上一層的概念;為了資訊使用(use)的目的,而發展出metadata。
wikipedia(2005)
Data warehouse metadata : 說明資料儲存結構相關資訊的資料。
File system metadata : 說明檔案系統架構的資料與檔案屬性的資料。
Program metadata : 應用程式內的資料,包含向作業系統描述程式運作所需的相關資訊。
Gilliland-Swetland (2000)
將metadata分為五種類型:
Administrative metadata : 管理詮釋資料
Descriptive metadata : 描述詮釋資料
Preservation metadata : 保存詮釋資料
Technical metadata : 技術性詮釋資料
Use metadata : 使用詮釋資料
Dempsey & Heery (1997)從使用者的觀點,認為 metadata 具有五項功能: (1) Location: 定位資訊 (2) Discovery: 揭露資訊 (3) Documentation: 描述紀錄資訊 (4) Evaluation: 評估資訊 (5) Selection: 選擇資訊
Greenberg, J. (2002)認為metadata與圖書館編目工作的相同點在於,兩者都是為了使容易發現資訊與其他功能性目的,而產生的一組結構化的描述資料。
相異之處,在於metadata一方面使用了新的網路技術,如新的編碼語言(XML)等,另一方面metadata利用的情境並不只限於對圖書館內資源的描述的情境,而更發展了各種其他用途與應用。因此,metadata比起圖書館編目,更加強調標準化(standardization)與互通性(interoperability),而更能應用到不同的領域。
項目(含其名稱及著錄內容)- Semantic
呈現方式(含其結構與次序)- Structure
敘述的語法 - Syntax
metadata是人類為了某種目的,而建構出來的內容。因此,metadata的內容需要符合其預設的目的性,而且是明確的目的性。Gilliland-Swetland (2000)所區分的五類metadata形式,基本上說明了五種不同目的的分野。然而,這也只是一個比較大範圍的區分,建構metadata時,需要更具體的功用情境。
因此,在為了資料輸入成本與資料儲存成本的考量下,metadata可能需要在最經濟的情況下,紀錄合乎目的性的資料,才能讓整個資訊系統有效的運作。
藍文欽(2004)也針對描述性詮釋資料所無法做到的事情,發展了六個「無力論」:
描述性後設資料得維持精簡的形式(compact or concise format) ,故無法包括物件的所有屬性或面向。
描述性後設資料以提供與物件有關的事實性描述為主,至於這些描述對讀者代表何種意義,則非描述性後設資料提供者所能充分掌握或預期。
以文字為主(text-based) 的描述性後設資料,無法充分呈現物件的某些特性,如:圖像、表格、聲音、影像等。
描述性後設資料中所提供的項目,有些可能是不常用或罕用,使用者常用的項目多集中在少數幾項。使用者在運用這些項目時,不一定會依循後設資料提供者所安排的順序,而是有自己的瀏覽模式或順序。
不同使用者對描述性後設資料的需求可能不同,不同的資料類型亦需要不同的資料項目,亦即一套劃一的描述性後設資料是無法滿足多樣化的需求。
描述性後設資料通常是以物件全體作為描述的對象,但資訊求者有興趣的,卻可能是物件中的某部分,是後設資料所不提供的。
Gill, T.(2000)認為,通行在網際網路上的metadata標準有三種,即 (1)在HTML中的meta tag 如“keyword”、“description” (2)Dublin Core Metadata Initiative (3)Resource Description Framework (RDF).
HTML中的meta tag 如“keyword”、“description” 之所以會有效用,是因為搜尋引擎如 AltaVista 會依賴這類資訊來決定網頁資源與使用者檢索之間的主題相關性,藉以建立檢索排序。這可以說是由作者自行提供主題分析內容,讓資訊檢索系統由此主題分析資訊,來與使用者經由自然語言與切截等檢索語言所表徵的資訊需求資訊,加以比對與排序。不過目前大部分的搜尋引擎已經減少或中止使用HTML中的meta tag來作為相關性判斷的依據,因為網路上出現過多的 Meta tag spamming ,降低整體的資訊相關程度的正確性。
DC (Dublin Core) 用 15個不同的元素欄位來描述一個資訊資源。
references
Coyle, K. (2005). Understanding metadata and its purpose. /Journal of Academic Librarianship/, 31(2), 160.
-
Gilliland-Swetland, A. J. (2000). Setting the state. In M. Baca (Ed.), Introduction to metadata: Pathways to digital informaiton. Los Angeles, CA: Getty Information Institute.
Greenberg, J. (2002). “Metadata and the World Wide Web” Encyclopedia of Library and Information Science, V.72, p. 245.
Gill, T. (2000). Metadata and the World Wide Web. In M. Baca (Ed.), Introduction to metadata: Pathways to digital informaiton. Los Angeles, CA: Getty Information Institute.
藍文欽. (2004). 描述性後設資料之「無力論」. In 王振鵠教授八秩榮慶籌備小組 (Ed.), 王振鵠教授八秩榮慶論文集 (pp. 273-282). 台北: 學生書局.
-