1.商務智能關鍵技術
商務智能涉及的信息技術主要包括:ETL、數據倉庫、商務智能應用技術等。
ETL是指采用數據抽取(Extraction)、轉換(Transformation)和加載(Loading)等技術,從業務系統或外部系統抽取數據,并以數據倉庫需要的格式和形態,在規定的時間裝入到數據倉庫中去。ETL工具的關鍵技術在于能夠快速從源系統抽取增量數據,提供并行的多任務數據抽取進程,通過計劃作業,提供豐富的數據轉換處理功能,其中尤為關鍵的在于如何捕獲業務系統的增量數據。大多數的ETL工具主要是依靠捕獲數據庫表記錄變化來獲得增量。少量的ETL工具則是基于應用級來捕獲增量,一般這種工具都是配合專有應用使用,比如,SAP公司的ERP可以產生應用級的增量數據變動,但是其增量僅提供SAP BW產品數據抽取使用。通用的ETL工具包括Oracle公司的Oracle Data Integrator,IBM公司的DataStage,SAP Business Objects公司的Data Integrator,以及Informatica公司的數據集成產品。
數據倉庫( Data Warehouse)是面向主題的、集成的、穩定的、不同時間的數據集合,為分析和決策提供一個完整的應用視圖,為數據挖掘、數據分析提供統一的應用界面和訪問接口,是商務智能總體技術架構的核心。數據倉庫中的數據存儲方式,存在兩種主要的不同途徑。Ralph. Kimball建議采用維度模式,即數據倉庫中的數據需要按照維度構造模型,或者是常說的雪花模式構造模型。而William H.Inmon則強調數據倉庫中的數據需要采用實體一關系模型(E-R模型)或者俗稱的第三范式模型。在數據倉庫的建設上,Kimball建議采用自底向上的方式,即先為特定業務部門提供報表及分析的數據集市,然后通過總線將不同的數據集市集成在一起從而構成一個整體的數據倉庫。Inmon則建議采用自頂向下的模式,要從企業的整體上來構建數據倉庫,數據倉庫中的數據必須是“原子”數據,保持最細的數據粒度,數據倉庫是企業信息資源庫的核心,滿足部門報表和分析的數據集市必須基于數據倉庫基礎之上來建立。Inmon方式建設的數據倉庫從企業整體架構而言更為堅固,但是采用這種方式的成本很大,建設周期很長,業務部門在一定時間內無法受益。長久以來Kimball的方式占據了上風,很多企業面向部門需求建設了大量的部門數據集市,但是這種建設方式的弊端也是顯而易見的,主要是數據不一致,數據冗余和面臨業務變革調整困難,近些年全球大型企業開始對建設的數據集市進行整合,重新回到Inmon的集中數據倉庫模式。