時至今日,我們的數據管理能力日益提升,但數據分析能力則相對落后。盡管工具與流程皆已齊備,但仍然缺少充足的數據科學家人員。中培《大數據分析及可視化技術應用實戰》培訓專家謝老師作為行業資深專家,長期致力于對大數據應用方面的研究。對于大數據應用在未來的發展趨勢,謝老師也發表了自己的看法。
謝老師指出,信息技術中的每個新興領域(例如商務智能、客戶端服務器計算、云計算以及移動計算等通常都需要經歷三個發展階段:
基礎設施部署。在大數據領域,此類基礎設施負責對數據進行存儲、管理、移動與傳輸。
工具部署。在大數據領域,此類工具用于搜索并分析各種形式的大數據并呈現處理結果。 應用程序引入,通常將基礎設施與工具轉化為實際功能。 遵循這樣的分階段實現方式,眾多大型企業已經開始部署大數據基礎設施與多種工具,旨在分析收集到的海量數據。
由于我們已經進入應用開發與部署階段,因此最重要的是著眼于具體軟件。截至目前,我們已經發現了三種主要大數據應用類型:
淺層應用,包括執行客戶流失分析并圍繞通用型分析工具進行開發(例如DataminrDataRobot。 這些應用由數據科學家負責支持,從而執行經過嚴格定義的任務流程。這些應用通常只能在運行基礎之上提供淺層分析能力。這些由分析模型與報告機制驅動的應用 由數據科學家及服務專家進行開發與維護——他們往往來自管理咨詢企業,且充分理解相關業務領域及最終用戶需求。最終用戶通常為商業分析師。
應用能夠處理大數據,但無法實現任何形式的預測或預測性分析(例如SocrataZuora)。 這類應用可能面向水平或垂直體系,其能夠為最終用戶——主要為商業分析師——提供理解數據并形成結論報告的能力。
具備嵌入式預測性分析的應用。此類應用未來將分為以下兩種類別。
1.包含預測模型,并由數據科學家負責開發與定期更新。這意味著應用供應商必須擁有強大的服務能力以支持軟件功能。此類應用包括AgileOneOPowerZephyr HealthDuetto以及DataXuMediaMath等在線廣告應用方案。
2.所使用的預測模型可由應用本身自動構建。
歸屬于這一類別的應用可能面向橫向或垂直領域。
這三種大數據應用類型可被視為應用領域的開創者,如今以其為基礎又有第四種見解型應用開始出現。之前提到的第三種應用同見解型應用最為接近,但二者間又存在著重要差異:其能夠做出預測,但無法形成見解。換言之,第三種應用無法根據預測結果執行對應操作。相反,它們依賴于用戶來識別特定預測結果并執行對應行為。
謝老師最后總結道,盡管仍然面臨多種障礙(每一種新興技術在出現后都必須面對挑戰,但大數據的早期采納方已經在相關項目當中積極投資,并將其部署至企業業務系統當中 以解決各類關鍵性難題。為了實現大數據的跨行業處理潛能,各風險投資方都在積極為大數據初創企業提供援助,希望其解決方案能夠為大型企業客戶所采納。
考慮到已經陸續出現的大量大數據基礎架構及部署分析工具,多數企業開始將注意力轉向大數據應用程序。我們確定的這三種具體類型涵蓋了相繼出現的各類新型大數據 應用。其中一些能夠提供預測結論,但卻無法實現見解與實際行動,這亦是大數據應用尚未徹底發展成熟的主要標志。在未來的文章中,我們將深入探討見解型應用 ——即第四類亦是最具發展前途的大數據應用類型。