▌企業(yè)大數(shù)據(jù)建設(shè)頂層愿景
現(xiàn)有數(shù)據(jù)平臺(tái)是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)架構(gòu)。大量的用戶上網(wǎng)、用戶行為等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)無(wú)法保存和處理,缺乏非結(jié)構(gòu)化數(shù)據(jù)的處理能力。用戶上網(wǎng)行為等互聯(lián)網(wǎng)行為數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)方式保存至數(shù)據(jù)倉(cāng)庫(kù)中。由于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)處理流程與業(yè)務(wù)保持緊密關(guān)聯(lián)。整個(gè)數(shù)據(jù)加工流程為最終應(yīng)用服務(wù)。為緩解存儲(chǔ)壓力在數(shù)據(jù)抽取和清洗階段會(huì)過(guò)濾掉與業(yè)務(wù)無(wú)關(guān)的數(shù)據(jù)記錄和字段。每個(gè)應(yīng)用需求的變化就是一場(chǎng)災(zāi)難。由于數(shù)據(jù)處理與業(yè)務(wù)的緊密關(guān)聯(lián)可能需要對(duì)中間每個(gè)處理環(huán)節(jié)進(jìn)行逐個(gè)調(diào)整。重新生成數(shù)據(jù)的周期也非常緩慢。面對(duì)海量的數(shù)據(jù)壓力,需要大數(shù)據(jù)平臺(tái)提供快速的處理能力。
大數(shù)據(jù)建設(shè)是企業(yè)的頂層設(shè)計(jì)問(wèn)題。目前企業(yè)都是通過(guò)運(yùn)營(yíng)商進(jìn)行大數(shù)據(jù)平臺(tái)建設(shè),而諸如通信行業(yè)的運(yùn)營(yíng)商多是通過(guò)分層多維進(jìn)行的建設(shè)。例如,運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)中主要分為分別為數(shù)據(jù)采集層、數(shù)據(jù)處理層、數(shù)據(jù)分析層、數(shù)據(jù)訪問(wèn)層及應(yīng)用層。
企業(yè)通過(guò)大數(shù)據(jù)建設(shè),目標(biāo)是構(gòu)建集中化、大容量、高擴(kuò)展、高可用數(shù)據(jù)庫(kù)平臺(tái)能夠支持全網(wǎng)型數(shù)據(jù)、跨部門(mén)數(shù)據(jù)的整合,形成集中化管理的企業(yè)級(jí)數(shù)據(jù)中心;支持互聯(lián)網(wǎng)時(shí)代更高的實(shí)時(shí)性要求、支持;打造動(dòng)態(tài)資源共享能力,支持資源動(dòng)態(tài)按需供應(yīng);構(gòu)建可重用的標(biāo)準(zhǔn)化數(shù)據(jù)服務(wù)組件,支持一次開(kāi)發(fā)、全局共享的模式,形成規(guī)模型效益。
所以,適應(yīng)數(shù)據(jù)集中化趨勢(shì)使得企業(yè)面臨著海量數(shù)據(jù)的存儲(chǔ)及分析問(wèn)題,大數(shù)據(jù)在支撐互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展趨勢(shì)中,充當(dāng)重要角色。
想了解更多IT資訊,請(qǐng)?jiān)L問(wèn)中培偉業(yè)官網(wǎng):中培偉業(yè)