1.2.1 銀行數據的來源及特征
我國商業銀行通過廣泛的渠道及豐富的產品,在業務開展過程中積累了大量的數據,如客戶數據、業務處理數據、內部管理數據、外部數據、系統日志等。特別是近年來,隨著社交網絡、微博、微信、論壇的興起,數據來源也已從傳統的結構化數據逐漸擴展到以網絡日志、社交媒體為代表的半結構化和非結構化數據,銀行數據量呈現幾何級數的爆發式增長,商業銀行逐步進入大數據時代。
大數據時代已經悄然而至,認同這一觀點的人越來越多。那么銀行的數據到底從哪里來?銀行有哪些數據?下面將從技術角度加以解惑,充分介紹它作為新時代變革力量的根本原因。
1.銀行的數據是什么
銀行業數據原來是金融產品、業務處理、運營管理以及客戶服務的副產品,只在后臺起支撐作用。隨著信息科學技術進步和數據處理能力的提高,大量的數據以結構化或非結構化的形式在IT信息系統中傳輸、儲存、轉換、分析和挖掘,并產生能夠為特定業務領域服務的信息。
圖1-2所示為銀行的信息與數據。
隨著網絡技術的發展,特別是Internet(因特網)和Intranet(內部網)技術的飛速發展,商業銀行在使用互聯網技術、不斷提升客戶服務水平和加強風險管理的同時,存款、貸款及匯款(簡稱存貸匯)等核心業務的結構化數據與日俱增,而電子商務、移動應用、社交網絡日益活躍,導致電話語音、網上銀行交易記錄、電子影像、網點視頻、掃描文件、微博、即時通信等非結構化數據(圖1-3)、半結構化數據也日趨增大,非結構化數據的增長幅度遠遠大于結構化數據。