信息化時代的快速推進所產生的海量信息,讓全球迎來了一個大數據時代。處于這個行業上冊的大數據精英無疑成為這個行業乃至時代的引領和驅動者。中培偉業《大數據分析及可視化技術應用實戰》專家謝老師認為,要想成為大數據的精英人才,除了專業水平之外,還應該具備以下5種專業特質:
特質一:定義和厘清問題
好的數據科學家具備什么條件,一般可以分成兩種等級:一種是是別人幫你把問題定義好,然后你來解開,但更厲害的是你知道怎么找問題,什么問題才是重要的,自己發現問題。要定義最有前瞻性最重要的問題,結果不只正確還要顯著性,對各領域發展有貢獻,要有商業價值和技術進步的空間,兩者能兼備是最好的。在分析數據時定義問題的能力很重要,因為問題分成很多層面,數據科學家必須要看當下要解決什么問題,再用那個指標去回答。因此數據科學家首要具備的條件就是:定義和厘清問題。
特質二:想像力
不要以為數據科學家整天在電腦前面工作,只要一板一眼地分析數據就好,其實想像力也很重要。有一定的創意才能幫助自己找到不一樣的觀點,學校會訓練你使用習慣的工具,但你應該要嘗試各種可能,如果沒有專業知識判斷,最后得到的結果就會跟大家差不多。
例如一些提供大數據解決方案的公司常會需要幫助客戶找到具有某種特征的族群,這個時候若只靠經驗和專業是不夠的,還需要發揮一些想像力。我們在描述一個人的行為傾向時是很多維度的東西去做整合,除了你對生活經驗的豐富度之外,你還要有創意去描述這種人具有什么樣的行為特征,我們再透過機器學習的輔助,幫助你快速收集這些特征背后隱含的意義是什么,不然一般人就是我想到什么樣的資訊我就勾一勾,這是遠遠不夠的。
特質三:邏輯思考能力
數據科學家的工作時常需要建立假設然后去驗證它,并且建立模型,這個過程依賴優秀的邏輯思考能力,否則追尋答案到一半可能不小心就會走到岔路。心理學的訓練幫助可以更容易了解他人的動機和想法,也因此在分析數據時常有意想不到的收獲。
以大數據科學家最討厭的機器人為例,這類的假數據抓不勝抓,又會影響到統計結果,令人不堪其擾,然而與其去思考機器人在哪里,要怎么抓,不如反向思考什么樣的網頁需要機器人,機器人的數據從哪里來,就像是偵探福爾摩斯一樣,偵探怎么找出犯人,他不是從犯案手法去看的,而是從動機。
特質四:基礎數理與資訊工程能力
大數據科學家不一定非得要是理工學院或電資學院出身的,但還是必須具備基礎數理與資訊工程能力。
你也許可以用Excel去處理數據,但如果想要加快資料處理速度的話,程式能力依然是必須的。不害怕數字很重要,必須要培養對數字的敏銳度;在工具之外,最重要的還是商業嗅覺,現在很多人隨隨便便就說自己會做數據分析會用什么資訊工具,但沒有商業眼光依然白搭。
特質五:跨界合作能力
最后,由于大數據科學家必須膽大心細又要天馬行空,邏輯好之外還得要融合自身生活經驗,這些特質要在一個人身上面面俱到非常困難。跨界合作能力在這里就顯得格外重要,因為不同的產業別需要不同的觀點,如果不懂得傾聽別人的意見,恐怕陷入盲點而不自知,跨界合作有助于發現不同面向切入分析,更有效率地做決策。
“在大數據領域的英雄不是圖靈,也不是克勞德·夏農(發明資訊概論的人),而是福爾摩斯;如果只是因為大數據很紅就去學習大數據,你學這些也許只能賺22W的,但是如果先掌握這些特質,把專業領域做好,你就可以賺220W。因此,與其盲目追隨大數據熱潮,不如看看自己是否具備這些特質以及專業,再來決定要不要加入大數據淘金潮。