12. 2.1 結(jié)構(gòu)化數(shù)據(jù)處理系統(tǒng)
當(dāng)前銀行業(yè)數(shù)據(jù)處理與應(yīng)用主要針對(duì)結(jié)構(gòu)化數(shù)據(jù),其過(guò)程就是數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展過(guò)程。數(shù)據(jù)倉(cāng)庫(kù)的概念大約在20世紀(jì)70年代到80年代形成,在理論層面上基本認(rèn)同了以下觀點(diǎn):
應(yīng)當(dāng)把那些新出現(xiàn)的、不可以預(yù)測(cè)的、大量存在的分析型負(fù)載從業(yè)務(wù)處理系統(tǒng)中剝離出來(lái),采用專門的體系架構(gòu)和設(shè)計(jì)來(lái)進(jìn)行處理。數(shù)據(jù)分析和業(yè)務(wù)處理存在相當(dāng)大的差異,以至于需要用具有不同體系結(jié)構(gòu)的系統(tǒng)來(lái)分別處理它們,這就導(dǎo)致了數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn)。一個(gè)典型的數(shù)據(jù)倉(cāng)庫(kù)服務(wù)體系如圖12-2所示。
數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)的建設(shè)實(shí)現(xiàn)了企業(yè)異構(gòu)數(shù)據(jù)的集成,企業(yè)按照分析主題重組數(shù)據(jù),建立了面向整個(gè)企業(yè)的一致的信息視圖。在此基礎(chǔ)上,結(jié)合數(shù)據(jù)挖掘、聯(lián)機(jī)分析等技術(shù),為實(shí)施精準(zhǔn)化營(yíng)銷、有效控制企業(yè)風(fēng)險(xiǎn)。實(shí)現(xiàn)經(jīng)營(yíng)資源的優(yōu)化配置等提供了數(shù)據(jù)基礎(chǔ),全面提升了數(shù)據(jù)的共享水平,深入挖掘了數(shù)據(jù)的業(yè)務(wù)價(jià)值,大大增強(qiáng)了決策的科學(xué)性。數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)的數(shù)據(jù),需要進(jìn)一步轉(zhuǎn)化為能實(shí)際應(yīng)用的知識(shí),用于指導(dǎo)后續(xù)工作,這樣才能充分發(fā)揮其數(shù)據(jù)的價(jià)值。數(shù)據(jù)挖掘利用了來(lái)自統(tǒng)計(jì)學(xué)的抽樣、估計(jì)和假設(shè)檢驗(yàn),人工智能、模式識(shí)別、機(jī)器學(xué)習(xí)的搜索算法、建模技術(shù)和學(xué)習(xí)理論,通過(guò)數(shù)理模式來(lái)分析企業(yè)內(nèi)儲(chǔ)存的大量資料,以找出不同的客戶或市場(chǎng)劃分,分析出消費(fèi)者的喜好和行為。數(shù)據(jù)挖掘需要數(shù)據(jù)庫(kù)系統(tǒng)提供有效的存儲(chǔ)、索引和查詢處理支持,源于高性能(并行)計(jì)算的技術(shù)在處理海量數(shù)據(jù)方面常常是重要的。因此,數(shù)據(jù)倉(cāng)庫(kù)往往和數(shù)據(jù)挖掘技術(shù)密不可分,而數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)倉(cāng)庫(kù)海量數(shù)據(jù)的支撐下,更能發(fā)揮其重要作用。通過(guò)數(shù)據(jù)倉(cāng)庫(kù)中的海量數(shù)據(jù),建立一定的數(shù)據(jù)挖掘模型,用于預(yù)測(cè)客戶的產(chǎn)品需求和行為特征,作為后續(xù)營(yíng)銷、決策的依據(jù),這將是數(shù)據(jù)倉(cāng)庫(kù)后續(xù)主要的發(fā)展方向之一。