第7章 數據質量管理
數據質量用以描述數據對使用者有價值和有用的程度。從本質上來說,數據質量問題是信息失真的表現,不同程度上影響了銀行相關業務的開展,導致客戶滿意度下降,同時也降低了統計信息的可用性。因此,必須從各階段人手進行數據治理,防范信息失真,有效提高數據質量。
數據質量問題產生的因素有多個方面,主要有設計問題、傳輸和使用問題、操作問題等方面。正因為數據質量產生于多個方面,因此其治理的難度不言而喻,例如:
1)由于歷史原因造成大量缺失數據和錯誤數據,比較典型的就是早期銀行開戶時對客戶信息控制不嚴格,從而造成客戶信息缺失或錯誤。
2)需求考慮不周導致數據質量問題的產生。需求人員在擬定需求時,往往從當前使用場景出發,對后續使用場景以及與其他系統之間的關聯關系考慮較少,出現系統間數據不一致,當前數據無法滿足新業務場景使用等情況。
3)操作不合規形成數據問題。操作人員在操作時錯誤或不嚴謹,也會導致問題產生,比如輸入隨意的11位數字用作手機號碼等。
只有數據質量提高了,才能更好地服務客戶,提升銀行經營管理水平。例如,完整的客戶信息可以有效地分析客戶行為,給客戶提供更為全面的服務;系統間一致的數據可以提升數據的共享程度等。