什么是大數據?數據可視化如何幫助企業更好地利用數據資源?一些人知道大數據的真正含義,然而其他人聲稱自己懂大數據,只是為了讓他們看起來并不低人一等。盡管大數據是一個熱門話題,但是對許多企業和數據專業人員來說,它仍然很難理解。 Kimberly-Clark的全球總監Robert Abate,在“數據可視化的智慧”中討論人們對大數據的無知。他認為,大數據話題和大數據的神秘就像青少年的人際關系問題。他說:“每個人都在討論大數據,但是沒有人真正地知道如何去處理。這是許多傳言的來源。每個人都認為其他所有人都在研究大數據,所以都說自己也在研究。”
然而按定義來說,什么是大數據呢?很明顯,大數據是指大量的能夠收集、存儲的原始數據,經過各種分析可以揭示企業的行為模式和發展趨勢,尤其是消費者的。它可以用于最大限度地發揮業務潛力。這就是Robert Abate在演講開始時明確指出的一點。他說的重點是,通過數據可視化能夠有效地利用大數據。
為什么大數據如此重要?
他說,大數據對企業那么有用是因為它可以給企業的許多問題提供答案,而這些問題他們先前甚至都不知道。換句話說就是它提供了參考點。有了這樣大的信息量,公司可以用各種它們認為合適的方法重新處理數據或進行測試。這樣,就能用一種更容易理解的方式查明問題。收集大量數據,并在數據中發現趨勢,使企業能夠更快、更平穩、更有效地發展。這也可以讓它們在利益和名聲受損之前排除一些問題。
沒有數據的幫助,企業采取的無數行動都可能威脅、損害或徹底毀滅企業。數據就像公司呼吸的空氣。正如人們沒有氧氣不能生存一樣,公司沒有維持生存的必要數據也不能存活。沒有這種空氣,公司將會窒息而死。
每家公司都在使用數據。一個公司使用數據越有效,它的潛力就越大。這樣的真理眾所周知,但是據Abate先生說,許多企業還沒有真正領悟這簡單的思想:
“我們面臨的一部分挑戰是如何向企業說明數據能夠做什么,業務如何成為真正的主題。我們不得不解決如何進行數據溝通和怎樣與它們創建直接聯系。”
大數據,尤其是跟信息圖表和可視元素用在一起時,能夠更快地得到問題的答案。這是一個理想,因為公司從來源中獲取信息越快,獲得答案就越快。他說,只是擁有更多信息并不能產生速度。沒有人處理這些數據讓它們更有意義,那么它們仍然是原始數據,沒有任何價值。更多的人處理數據不等于有更多的優勢,同樣,員工越多不會提高生產力,反而會阻礙生產效率的提高。
如果一個組織能夠將更多的事務有效地進行可視化顯示,那么他們可以提高認知能力。Abate先生打比方說,許多人都在工作,他們只使用一臺電腦顯示器,但一臺電腦顯示器只能做那么多:它有局限性。這使得個人不能夠提高他的潛力。如果一個人有兩臺電腦顯示器甚至三臺,他們解決各種問題以及得出結論的能力將會提高。如果他們有更多的資源,他們也會更好地利用自己的時間。當涉及到大數據時,“一張圖片勝過千言萬語”還不足以說明圖片的重要性。人們很容易地以可視的或物理的角度觀察數據,它比看表格容易的多。
他給了一個簡單的解釋:“簡單地說,如果西南部的銷售額下降,人們可以使用另一臺電腦或電話查到西南地區的天氣。這樣,人們會意識到西南部有一場暴風雪,這就解釋了為什么這個星期的銷售額驟然下跌了。因為很明顯,如果人們不能到達商店,他們就不會買東西。”
為什么突然依賴大數據?
大量的手機、平板電腦、翻轉電腦、云計算及傳感器和物聯網的出現,產生了人們不可想像的數據量。根據演講資料的揭示,這兩年產生的數據量,超過了此前的歷史上的數據量。雖然,20世紀50年代就有計算機網絡,但數據量激增是近年的事情,人們將更會注意到大數據的力量。
現在,每60秒,至少98000條推特出現在推特網上;每60秒,Facebook更新69500條動態;每60秒,1100萬即時信息被發送;每60秒,有698445條谷歌搜索;每60秒,至少1億6800萬封電子郵件被發送;每60秒,1820TB的數據被創建。
這也難怪,為什么過去的兩年時間里產生的數據量,就超過了歷史上其它時間的總和。
但是,如果沒有方法使信息形成數據湖或其它的形式,所有這些信息都是無用的。
充分利用數據
了解數據具有的特點是成功使用大數據的關鍵。人們都知道“了解你的客戶”,會使公司營銷有更高的成功率。
他給出了一個案例,他的團隊幫助他們的客戶整理數據。他們從數據集中刪除了任何不相關的或離群的數據,從而縮小到一個關鍵問題或用戶信息統計。這樣,他們就能分辨出哪一類產品出售的多,哪一類產品沒有出售,因此可能要被淘汰。他們關注4個主要的數據:收入、頻率、價值、年期。Abate先生強調,同一時間,在任何給予的可視化范圍內,超過4個數據就會讓人更難跟蹤。通過淘汰沒有出售的產品,他們正在減少浪費來增加未來的收入。但是沒有數據可視化,他們不可能完成這項工作。
數據可視化是關鍵。通過增加數據可視化使用,企業能夠發現他們追求的價值。創建更多的信息圖表,使用更多的資源,讓他們更快地獲得更多的信息。這使他們意識到他們已經知道很多信息,而這些信息先前就應該是很明顯的。這就增加了部門的作用,因為他們能夠提出更好的問題。它創建了似乎沒有任何聯系的數據點之間的連接。人們能夠分辨出有用的和沒用的數據,這樣,就能最大限度的提高他們的生產力,讓信息的價值最大化。
利用大數據資產對任何公司來說都是很重要的,不論公司大小。當大數據的潛力通過可視化達到最大時,之前未看到的趨勢就很容易被發現。正如Abate先生談到的,這些趨勢可以提供“信息”并能轉化成有價值的“見解”,如:誰是他們的客戶,他們有多少客戶,誰是高端客戶,誰是低端客戶等等。
最后,他討論一些關鍵注意事項。他說,大數據可視化是未來的發展趨勢,使用更多的工具來獲得更多的見解也是必須的。他列舉了一些最佳實踐方法:建立迭代、每個圖形最多含4個主要因素、可視化動態情形、以及預防極端情況的網絡規模升級計劃。