國(guó)際數(shù)據(jù)管理協(xié)會(huì)(DAMA)給出的定義:數(shù)據(jù)治理是對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動(dòng)集合。
數(shù)據(jù)治理的最終目標(biāo)是提升數(shù)據(jù)的價(jià)值,涉及到數(shù)據(jù)的整個(gè)生命周期管理、數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全性和合規(guī)性管理等多個(gè)方面。
數(shù)據(jù)治理主要有以下5點(diǎn):
1、理清數(shù)據(jù)資源
首先要明確企業(yè)內(nèi)部的各類數(shù)據(jù)資源,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等,以及這些數(shù)據(jù)的來(lái)源、質(zhì)量和使用情況。這個(gè)步驟可以通過(guò)對(duì)業(yè)務(wù)部門的需求調(diào)研、對(duì)現(xiàn)有系統(tǒng)的了解和分析、以及對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估來(lái)完成。
2、制定治理規(guī)范
針對(duì)確認(rèn)過(guò)的數(shù)據(jù)資源,需要制定相應(yīng)的治理規(guī)范,包括數(shù)據(jù)清洗和整合的規(guī)則、數(shù)據(jù)格式和類型的定義、數(shù)據(jù)存儲(chǔ)和備份的方式等。需要考慮數(shù)據(jù)的完整性、準(zhǔn)確性、一致性、可讀性和可維護(hù)性等方面的要求,同時(shí)還需要考慮數(shù)據(jù)的安全性和可靠性等方面的要求。
3、數(shù)據(jù)清洗整合
根據(jù)治理規(guī)范,對(duì)原始數(shù)據(jù)進(jìn)行清洗和整合,包括去除重復(fù)和錯(cuò)誤的數(shù)據(jù)、補(bǔ)充缺失的數(shù)據(jù)、將不同來(lái)源的數(shù)據(jù)進(jìn)行合并和關(guān)聯(lián)等。數(shù)據(jù)清洗和整合可以提高數(shù)據(jù)的質(zhì)量和可用性,同時(shí)還可以減少數(shù)據(jù)的冗余和重復(fù)。
4、數(shù)據(jù)資源存儲(chǔ)
將清洗和整合后的數(shù)據(jù)按照規(guī)定的格式和流程錄入到數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中,同時(shí)進(jìn)行數(shù)據(jù)的質(zhì)量檢查和完整性驗(yàn)證。并需要考慮數(shù)據(jù)的準(zhǔn)確性、完整性和一致性等方面的要求,同時(shí)還需要考慮數(shù)據(jù)的可擴(kuò)展性和可維護(hù)性等方面的要求。
5、數(shù)據(jù)維護(hù)監(jiān)控
在數(shù)據(jù)存儲(chǔ)后,需要進(jìn)行數(shù)據(jù)的維護(hù)和監(jiān)控,包括定期的數(shù)據(jù)備份和恢復(fù)、數(shù)據(jù)質(zhì)量的監(jiān)控和管理等,以確保數(shù)據(jù)的安全性和可靠性。同時(shí)還需要對(duì)數(shù)據(jù)進(jìn)行分類、分主題地進(jìn)行整合,形成主題化的數(shù)據(jù)表,方便后續(xù)的數(shù)據(jù)分析和應(yīng)用。