互聯(lián)網(wǎng)的快速發(fā)展,尤其是存儲技術和設備的發(fā)展,讓傳統(tǒng)統(tǒng)計學上的數(shù)據(jù)和信息成長為今天的大數(shù)據(jù)。對很多人來說,大數(shù)據(jù)是新奇而陌生的。有人盲目排斥,有人則盲目崇拜。對于當前的大數(shù)據(jù)的發(fā)展狀態(tài)或者其發(fā)展特性,中培偉業(yè)專家對此發(fā)飆了自己的看法。
他表示,目前我們要正確認識大數(shù)據(jù),首先就應該認清以下事實:
基本事實1:人才是最重要的
大數(shù)據(jù)雖然帶來很多變革,影響深遠,但這并非全是數(shù)據(jù)的功勞。大數(shù)據(jù)只是個賓語,如果缺少主語,則構(gòu)不成一個完整的句子,而人就是主語。任何大數(shù)據(jù)項目都是由人提出、由人審核、由人實施、由人完善、由人監(jiān)督甚至由人結(jié)束的??梢哉f,大數(shù)據(jù)完全是由人推動的。
數(shù)據(jù)本身確實存在價值,大數(shù)據(jù)技術也很重要,計算機處理能力也重要,但這些都不是關鍵要素,重要的是人,尤其是那些面對繁瑣雜亂的數(shù)據(jù)仍有清醒頭腦,能提出明確需求和目標之人。在未來,首席信息官(CIO)可能比首席CEO更重要,決策也可能由CIO在進行數(shù)據(jù)分析的基礎上進行,而且這些人還可能決定著未來大數(shù)據(jù)的發(fā)展方向。
對企業(yè)來說,收集數(shù)據(jù)很重要,但更重要的是培養(yǎng)大數(shù)據(jù)人才,尤其是CIO,數(shù)據(jù)人才將是企業(yè)未來競爭中的利器。
基本事實2:目前收集到的大數(shù)據(jù)只是很少的一部分
信息處理能力有限時期,人們普遍采用采樣方式來收集數(shù)據(jù),這種方式難免會忽略掉很多數(shù)據(jù),而隨著計算機技術發(fā)展和云計算的興起,信息處理能力大幅提升,采樣獲得的少量數(shù)據(jù)已經(jīng)沒多大作用,因為人們可以采集到海量的數(shù)據(jù)。在海量數(shù)據(jù)基礎上進行分析,所得出的結(jié)論準確度更高,因而這種方式漸漸成為主流。不過很顯然,人們處理數(shù)據(jù)的方法并未跟上時代進步,在處理數(shù)據(jù)時難免會忽略掉很多數(shù)據(jù)。
根據(jù)某家大數(shù)據(jù)研究公司的調(diào)查:大多數(shù)企業(yè)在進行數(shù)據(jù)分析時,其分析數(shù)據(jù)量只占據(jù)他們所擁有的總體數(shù)據(jù)量的12%。被忽視掉的數(shù)據(jù)量占比近九成。企業(yè)之所以這么做原因可能是避免被“煮沸海洋”戰(zhàn)略拖累,減少數(shù)據(jù)分析成本,也可能缺少相關專業(yè)的數(shù)據(jù)分析工具。可以說這種方式好處是成本低,但其風險很高,被忽視掉的數(shù)據(jù)里可能隱藏著對企業(yè)發(fā)展至關重要的信息。
基本事實 3:大數(shù)據(jù)的發(fā)展離不開技術人員的推動
數(shù)據(jù)分析有數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)分析結(jié)果三部分,數(shù)據(jù)是本來就存在的,關鍵是如何對其進行整理、分析,然后找出關聯(lián)性,將數(shù)據(jù)轉(zhuǎn)化為有價值的信息。而這一切都離不開數(shù)據(jù)人才。根據(jù)麥肯錫預測,2019年,全球?qū)⑷鄙僦辽?9萬能對大數(shù)據(jù)進行分析的科學家。
目前大數(shù)據(jù)領域?qū)?shù)據(jù)專家的需求量猛增,而且隨著大數(shù)據(jù)越來越普及,數(shù)據(jù)專家的需求量必然會更多。與大數(shù)據(jù)相關的崗位也會興起,如未來建設智能社會的人才等。而且根據(jù)目前數(shù)據(jù)專家的薪酬來看,在美國,基礎類的薪酬為12萬美元/每年,那些更為高級的崗位其薪酬更高。薪酬高,需求量大,將來必然會吸引眾多人。
基本事實 4:大數(shù)據(jù)涉及到多種技術
數(shù)據(jù)處理是個相當復雜的過程,需要有各種不同的技能,雖說借助工具(如Hadoop)的幫助,能大大簡化數(shù)據(jù)處理過程,減輕人們的負擔,但就拿常用的Hadoop工具來說,人們需要掌握Java 編程技能、理解MapReduce、linux系統(tǒng)等,而且還需將數(shù)據(jù)轉(zhuǎn)化為有價值的信息,還可能需要了解統(tǒng)計知識、業(yè)務流程、圖表設計、SQL技能等。
因此,要成為一個大數(shù)據(jù)人才并不容易,至少得深入鉆研,懂得各種必備的技能,同時也要靈活運用,還要善于發(fā)現(xiàn)數(shù)據(jù)的關聯(lián)性等。
基本事實 5:每個人都與大數(shù)據(jù)密切相關
目前,很多政府都使用大數(shù)據(jù)進行管理,傳統(tǒng)的管理在面對海量數(shù)據(jù)時顯得很笨拙且臃腫,而使用大數(shù)據(jù)管理則做到有得放矢,能輕松處理各種數(shù)據(jù),理清思路,讓管理變得輕松且高效。
企業(yè)使用大數(shù)據(jù)尋找潛在客戶,對客戶全方位定位、分析,找出客戶喜好,以及最近的購買傾向。如企業(yè)生產(chǎn)了某種新型設備,而又通過大數(shù)據(jù)得知某客戶正打算擴大生產(chǎn),急需設備,因而企業(yè)就可以用電子郵件通知客戶;或者某酒商剛從外國運回了一批質(zhì)量高等的葡萄酒,那么,則可以運用大數(shù)據(jù)挖掘出潛在客戶,并對他們予以提醒;又或者某家化妝品通過數(shù)據(jù)分析顯示,上次某客戶在店內(nèi)購買的口紅快用完了,則可以通過電子郵件向該客戶推薦口紅。
大數(shù)據(jù)對個人的影響更是深遠,事實上,不管政府、企業(yè)還是機構(gòu)使用大數(shù)據(jù),最終都會落實到個人上。所以大數(shù)據(jù)涉及所有人。
當然,關于大數(shù)據(jù)的事實還有很多,而且隨著人們對大數(shù)據(jù)的認識加深,也會有更多的大數(shù)據(jù)事實暴露出來。