欧美麻豆久久久久久中文_成年免费观看_男人天堂亚洲成人_中国一级片_动漫黄网站免费永久在线观看_国产精品自产av一区二区三区

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 大數據平臺常見的相關步驟

大數據平臺常見的相關步驟

2017-02-15 17:06:16 | 來源:中培企業IT培訓網

在當今的大數據時代,大數據平臺的搭建也成為互聯網行業的熱門技術課題。中培偉業《大數據平臺搭建及高性能計算最佳實踐》專家蔣老師結合相關事件,在這里介紹了大數據平臺搭建的常見步驟及相關注意事項。

1. linux系統安裝 

一般使用開源版的Redhat系統--CentOS作為底層平臺。為了提供穩定的硬件基礎,在給硬盤做RAID和掛載數據存儲節點的時,需要按情況配置。例如,可以選擇給HDFS的namenode做RAID2以提高其穩定性,將數據存儲與操作系統分別放置在不同硬盤上,以確保操作系統的正常運行。 

2. 分布式計算平臺/組件安裝 

目前國內外的分布式系統的大多使用的是Hadoop系列開源系統。Hadoop的核心是HDFS,一個分布式的文件系統。在其基礎上常用的組件有Yarn、Zookeeper、Hive、Hbase、Sqoop、Impala、ElasticSearch、Spark等。

3. 數據導入

前面提到,數據導入的工具是Sqoop。用它可以將數據從文件或者傳統數據庫導入到分布式平臺『一般主要導入到Hive,也可將數據導入到Hbase』。

4. 數據分析

數據分析一般包括兩個階段:數據預處理和數據建模分析。

(1)數據預處理是為后面的建模分析做準備,主要工作時從海量數據中提取可用特征,建立大寬表。這個過程可能會用到Hive SQL,Spark QL和Impala。

(2)數據建模分析是針對預處理提取的特征/數據建模,得到想要的結果。如前面所提到的,這一塊最好用的是Spark。常用的機器學習算法,如樸素貝葉斯、邏輯回歸、決策樹、神經網絡、TFIDF、協同過濾等,都已經在ML lib里面,調用比較方便。

5. 結果可視化及輸出API

可視化一般式對結果或部分原始數據做展示。一般有兩種情況,行數據展示,和列查找展示。在這里,要基于大數據平臺做展示,會需要用到ElasticSearch和Hbase。Hbase提供快速『ms級別』的行查找。 ElasticSearch可以實現列索引,提供快速列查找。

6. 平臺搭建主要問題: 

(1)穩定性 Stability 

理論上來說,穩定性是分布式系統最大的優勢,因為它可以通過多臺機器做數據及程序運行備份以確保系統穩定。但也由于大數據平臺部署于多臺機器上,配置不合適,也可能成為最大的問題。 曾經遇到的一個問題是Hbase經常掛掉,主要原因是采購的硬盤質量較差。硬盤損壞有時會到導致Hbase同步出現問題,因而導致Hbase服務停止。由于硬盤質量較差,隔三差五會出現服務停止現象,耗費大量時間。結論:大數據平臺相對于超算確實廉價,但是配置還是必須高于家用電腦的。

(2)可擴展性 Scalability 

如何快速擴展已有大數據平臺,在其基礎上擴充新的機器是云計算等領域應用的關鍵問題。在實際2B的應用中,有時需要增減機器來滿足新的需求。如何在保留原有功能的情況下,快速擴充平臺是實際應用中的常見問題。

想了解更多IT資訊,請訪問中培偉業官網:中培偉業

標簽: 大數據平臺
主站蜘蛛池模板: 国产女人与公拘交在线播放 | 一本色道久久88精品综合 | 青青青手机兔费视频在线观看 | 日韩福利一区二区 | 男人的天堂官网 | 宝贝小嫩嫩好紧好爽H视频 神马午夜羞羞AV | 在线播放免费人成视频在线观看 | jizzjizz日本护士 | 色欲香天天天综合网站无码 | 欧美性猛交XXXX乱大交 | 在厨房被c到高潮 | 精品国产乱码久久久久软件 | yw尤物av无码 | 妺妺窝人体色www在线小说 | 最新精品在线 | 校园春色另类小说 | 国产成人自拍小视频 | 一区二区三国产精华液 | 青青热久免费精品视频在线播放 | 亚洲精品中文字幕一区二区三区 | 99热3| 亚洲一区二区三区在线网址 | 色伊人亚洲综合网站 | 白嫩少妇高潮喷水 | 福利一区二区福利刺激微拍 | 开心综合激激的五月天的 | 中文无码妇乱子伦视频 | 亚洲精品国产AⅤ综合第一 大又大粗又爽又黄少妇毛片免费 | 男人疯狂进入女人下部动态图 | 国产高清在线观看AV片麻豆 | 色噜噜狠狠综曰曰曰 | 五月天综合网缴情五月中文 | 伊人热| 国产乱码精品一品二品 | 国产熟女一区二区三区 | 天堂亚洲国产中文在线 | 黑人巨大av在线播放无码 | 国产无人区码卡二卡三卡 | 精品久久久久久无码专区不卡 | 国产日韩欧美一区二区久久精品 | 野花香在线视频免费观看大全 |