大數(shù)據(jù)之所以能夠成為我來發(fā)展的趨勢,最重要的本身具有發(fā)展基礎。隨著互聯(lián)網(wǎng)技術的發(fā)展,物聯(lián)網(wǎng)和云技術的誕生,為大數(shù)據(jù)的儲存和傳輸嗲寧了基礎。此外,隨著社會的不斷發(fā)展,社會以及經(jīng)濟各領域的數(shù)據(jù)的積累也越來越大,這些多為大數(shù)據(jù)的誕生奠定了基礎。
中培的大數(shù)據(jù)專家蔣老師認為,當今社會正處于信息化時代,誰擁有了海量信息,誰就將在各種競爭中獲得主動權,日益豐富的數(shù)據(jù)來源和采集手段幫助我們解決了“巧婦難為無米之炊”的尷尬情況,但如果沒有滿足大數(shù)據(jù)存儲特點的創(chuàng)新存儲方法與技術手段,那么搜集到的“米”也因為無處存放而無法成“食”,所以期望大數(shù)據(jù)發(fā)揮價值的想法也只能停留在理論層面。
隨著大數(shù)據(jù)應用的爆發(fā)性增長,它已經(jīng)衍生出了自己獨特的架構,而且也直接推動了存儲、網(wǎng)絡以及計算技術的發(fā)展。國際數(shù)據(jù)公司認為:“在可預見的未來,存儲是大數(shù)據(jù)和分析領域最大的基礎設施開支之一?!碧幚泶髷?shù)據(jù)這種特殊的存儲需求是一個全新的挑戰(zhàn)。
站在今天的角度觀察,人類社會的信息化進程其實可以劃分為三個時代,即計算機時代、互聯(lián)網(wǎng)時代和大數(shù)據(jù)時代。到20世紀90年代中期,發(fā)達國家已經(jīng)基本度過了計算機時代。計算機的普及,解決了信息的機器可讀化和數(shù)據(jù)的可計算化問題。目前,發(fā)達國家和部分發(fā)展中國家也基本走完了互聯(lián)網(wǎng)時代的路程?;ヂ?lián)網(wǎng)的建立解決了信息傳遞和信息服務問題。在計算機和互聯(lián)網(wǎng)的基礎上,而今我們正步入一個全新的歷史階段—大數(shù)據(jù)時代。
劍橋大學教授維克托·邁爾-舍恩伯格在其《大數(shù)據(jù)時代:生活、工作與思維的大變革》中寫道:“大數(shù)據(jù)開啟了一次重大的時代轉型。就像望遠鏡讓我們感受宇宙、顯微鏡讓我們能夠觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務的源泉,而更多的改變正蓄勢待發(fā)……未來數(shù)據(jù)將會像土地、石油和資本一樣,成為經(jīng)濟運行中的根本性資源。”
2013年被國外媒體稱為“大數(shù)據(jù)元年”。大數(shù)據(jù)如浪潮一般席卷全世界,不僅在信息技術行業(yè)備受矚目,更成為變革科研、商業(yè)、政府運作方式乃至人類思維方式的一個熱點。
1969年,美國阿波羅登月艙使用的自動控制計算機內存容量只有 63KB(千字節(jié));而如今,一部普通的蘋果手機運行內存就有1GB(吉字節(jié)),是前者的6.45萬倍,這還不包括16~64GB不等的存儲內存。阿波羅登月艙只有一個,而僅在2013年第一季度,就銷售了大約3800萬部蘋果手機。人們用手機社交、購物、閱讀,產生的數(shù)據(jù)量是驚人的。
隨著計算機技術全面融入組織運作和社會生活,數(shù)據(jù)正在以一種超乎想象的速度爆發(fā)式地增長。據(jù)統(tǒng)計,人類存儲信息量增長速度是世界經(jīng)濟增長速度的5倍,而計算機數(shù)據(jù)處理能力增長速度則是世界經(jīng)濟增長速度的10倍。根據(jù)聯(lián)合國的研究報告,全球的大數(shù)據(jù)存量從2005年的150EB(艾字節(jié))增長到2010年的1200EB,并預計將以40%的年增長率繼續(xù)增長,2020年將達到2007年的44倍,平均每20個月翻一番。1E 1EB等于260B(字節(jié)),相當于13億中國人人手一本500頁的書加起來的信息量,5EB則相當于3.7萬個美國國會圖書館的信息量。
數(shù)據(jù)大爆炸的來源有很多,它既來自新興的物聯(lián)網(wǎng)和移動互聯(lián)網(wǎng),也來自傳統(tǒng)互聯(lián)網(wǎng)以及廣大經(jīng)濟社會活動領域。例如,每個人的日常生活都在被數(shù)據(jù)化,我們?yōu)g覽網(wǎng)頁、登錄社交網(wǎng)絡、使用移動通信工具、進行在線交易等,留了各式各樣的數(shù)字足
跡;在遍布全球的工業(yè)設備、汽車、電子量表和集裝箱上,有數(shù)不清的數(shù)據(jù)感應器,它們實時測量并傳遞地點、移動、振動、溫度和濕度等信息,甚至能檢測出空氣和水中的化學變化;政府部門在統(tǒng)計監(jiān)測、審批備案和行政執(zhí)法過程中,也積累了大量的工商登記、稅收繳納、社保繳費、交通違章等公共數(shù)據(jù)……
據(jù)采集、存儲、分析、可視化技術和方法的普及,使得對數(shù)量巨大、來源分散、格式眾多的大數(shù)據(jù)進行分析成為可能。因此,大數(shù)據(jù)首先是一種技術進步,這種進步繼而推動了人類認識世界和改造世界能力的進步,帶來了大價值。
MBAonline網(wǎng)站發(fā)布的一張題為“互聯(lián)網(wǎng)的一天”的信息圖顯示:每天有2940億封電子郵件發(fā)出,如果這些是紙質信件,在美國需要花費兩年的時間處理。每天有200萬篇博客文章在網(wǎng)上發(fā)布,這些文章相當于美國《時代周刊》刊發(fā)770年的總量。每天有2.5億張照片上傳至社交網(wǎng)站臉譜網(wǎng),如果把它們都打印出來,摞在一起有80個埃菲爾鐵塔那么高。每天有86.4萬小時的視頻被上傳至視頻網(wǎng)站Youtube,不間斷播放則需98年。
每天有1.87億個小時的音樂會在流媒體音樂網(wǎng)站Pandora上播放,如果一臺計算機從公元元年就開始播放這些音樂會,到現(xiàn)在還沒完沒了地接著放。累積起來,互聯(lián)網(wǎng)一天之內產生的信息總量可以裝滿1.68億張數(shù)
大數(shù)據(jù)能為人類帶來大知識,即通過對海量數(shù)據(jù)進行分析,以一種前所未有的方式獲得深刻洞見。例如,2009年甲型H1N1流感爆發(fā)時,與習慣性滯后的官方數(shù)據(jù)相比,谷歌成為一個更有效、更及時的指示標。他們通過分析5000萬條美國人最頻繁檢索的詞條,例如“哪些是治療咳嗽和發(fā)熱的藥物”,建立了4.5億個數(shù)學模型,并與美國疾控中心在2003~2008年季節(jié)性流感傳播時期的數(shù)據(jù)進行比較,提前兩周預測出流感的爆發(fā)時間和傳播路徑。這種工作方式不需要分發(fā)口腔試紙和聯(lián)系醫(yī)院,它是建立在大數(shù)據(jù)的基礎之上的?;谶@樣的技術理念和數(shù)據(jù)儲備,下一次流感來襲時,世界將擁有一種更好的預測工具預防流感的傳播。
大數(shù)據(jù)使得組織決策將越來越依賴于數(shù)據(jù)和分析,而非經(jīng)驗和直覺。邁克爾·劉易斯于2003年出版的《點球成金》中講述了棒球統(tǒng)計學的一個真實案例。該書的主角比利·比恩是一家棒球隊的總經(jīng)理,他在一位統(tǒng)計學家的幫助下,盡可能地將球員能力數(shù)據(jù)化,并以此作為衡量球員能力的唯一標準,而非基于主觀經(jīng)驗的判斷。通過這套計算機程序和數(shù)學模型,比利以有限的預算尋找那些被價值低估的球員,實現(xiàn)了最高的“投入產出比”,創(chuàng)下了美國職業(yè)棒球大聯(lián)盟百年歷史上的連勝20場的空前紀錄。與那位統(tǒng)計學家相比,專業(yè)棒球星探們在挑選球員方面的精準程度相形見絀。
人們通過大數(shù)據(jù)獲得的知識更快速、更準確、更便捷,而這些在傳統(tǒng)的數(shù)據(jù)利用思維和技術的基礎上是難以完成的。例如,個人收入對于銀行放貸、社會保障等機構而言是一項關鍵數(shù)據(jù)。然而,收入又是一個比較敏感的話題,要調查個人收入,不僅過程煩瑣、成本較高,而且還存在瞞報的可能。著名征信機構益百利有一項服務,即通過分析信用卡歷史記錄和美國國稅局的匿名稅收數(shù)據(jù),對個人的收入狀況進行較為精準的預測,其預測結果售價不足1美元,而通過傳統(tǒng)的辦法證明一個人的收入狀況要花費10美元左右。
正因為如此,大數(shù)據(jù)帶來的價值也將是巨大,除了其本身的價值之外,在大數(shù)據(jù)的幫助下,它能給整個社會帶來難以估量的價值。
想了解更多IT資訊,請訪問中培偉業(yè)官網(wǎng):中培偉業(yè)