5.1 元數據管理概述
1.元數據
人類大腦思維非常神奇,往往可以習慣地利用數據模型將數據和信息加以結構化,還可以利用元數據進行釋義并形成數據;同時,通過大腦思維的識別、轉化、擴充、統計、分析和挖掘等,可以獲取衍生信息,并同樣利用數據模型和元數據進行結構化和釋義。
元數據最早于1969年由Jack E.Myers提出。長期以來,在銀行領域,元數據主要應用在數據倉庫。在數據倉庫中,元數據是用以描述數據倉庫內數據的結構和建立方法的數據。
對于數據倉庫這類集成類數據系統來說,存儲的表、視圖等數據對象數以萬計,再加上內部復雜的數據抽取、加載和轉換,聯機分析處理( On Line Analytical Processing,OLAP)和數據挖掘,以及眾多的數據集市,很容易形成“蜘蛛網”現象。而解決“蜘蛛網”問題的關鍵就在于元數據管理,它可以幫助最終用戶理解和使用數據倉庫中的數據,也是保證數據質量的關鍵。同樣,它也應用在圖書館日常管理中。圖書館中的書籍多如繁星,要想在浩瀚的書海中快速準確定位到某種想要選擇的具體書籍,書簽必不可少,而書簽就是書籍的元數據。
根據銀行數據特點,結合業界理論和實踐經驗,元數據一般可以分為業務元數據、技術元數據、操作元數據三個類別,內容覆蓋結構化數據、半結構化數據以及非結構化數據。