數據治理是一項需要長期被關注的復雜工程,這項工程通過建立一個滿足企業需求的數據決策體系,在數據資產管理過程中行使權力、管控和決策等活動,并涉及到組織、流程、管理制度和技術體系等多個方面。一般而言,數據治理的治理內容主要包括下面幾個部分:
1. 標準問題:當公司業務部門比較多的時候,各業務部門、開發團隊的數據標準不一致,數據打通和整合過程中都會出現很多問題。
2. 質量問題:這是最重要的問題,很多公司的數據部門啟動數據治理的大背景就是數據質量存在問題,比如數倉的及時性、準確性、規范性,以及數據應用指標的邏輯一致性問題等。
3. 效率問題:在數據開發和數據管理過程中都會遇到一些影響效率的問題,包括數據研發效率,數據使用效率,很多時候是靠“盲目”地堆人力在做。
4. 成本問題:互聯網行業數據膨脹速度非常快,大型互聯網公司在大數據基礎設施上的成本投入占比非常高,而且隨著數據量的增加,成本也將繼續攀升。
5. 安全問題:業務部門特別關注用戶數據,一旦泄露,對業務的影響非常之大,甚至能左右整個業務的生死。