欧美麻豆久久久久久中文_成年免费观看_男人天堂亚洲成人_中国一级片_动漫黄网站免费永久在线观看_国产精品自产av一区二区三区

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 詳解hadoop與spark區別與未來發展趨勢

詳解hadoop與spark區別與未來發展趨勢

2016-07-11 11:32:09 | 來源:中培企業IT培訓網

對于大數據來說,hadoop與spark無疑是兩大組成架構。中培偉業《大數據Hadoop與Spark架構應用實戰》專家鐘老師指出,hadoop與spark作為大數據的兩大架構系統,二者有著競爭與承前啟后的關系。對于二者之間的區別以及后期的發展趨勢,鐘老師給出了自己的看法。

首先,spark對于海量數據計算,尤其是迭代運算,圖計算運算速度相比與hadoop有著量級上的增長。spark計算的時候將原始數據及中間結果都存儲在內存中,而hadoop每輪迭代都要講原始數據讀入,中間結果寫出到硬盤上。這樣一來由于spark省去了IO的時間,所以相比于hadoop,其運算速率有這量級上的增長。

其次,spark的容錯性很好,spark將海量數據抽象成RDD這種數據結構,并且其存在兩種算子,一種叫transformation,主要是用于對RDD進行數據轉換,一種叫action,是要將轉換好的RDD再轉換成原始數據。spark運算是一種懶惰運算,其程序執行邏輯是,對于一系列transformation算子,在遇到action算子之前,這些transformation是不會執行的,而會生成一個運算邏輯圖,當遇到一個action算子的時候,才根據前面的運算邏輯圖執行程序。這樣如果有臺機器宕機了之后,只需要根據邏輯圖將宕機中的RDD進行重新計算就可以了(窄依賴的情況下,寬依賴的情況下計算代價要更高。)

同時,spark與HDFS、Yarn/Mesos以及pregel有著很好的兼容性。但是畢竟spark起步晚,在性能、穩定性方面還有待提高;同時spark不能很好的處理細粒度、異步的數據。 

而Hadoop,性質和Spark并不一樣,它不僅僅是一個框架,而致力于發展成一個分布式計算的平臺。所以,現在的Spark是可以運行在YARN(Yet another Resource Negotiator)上的,而其他的一些框架也可以運行在這個平臺上,達到資源共享的目的。

spark相對hadoop編程模型簡單,能進行迭代操作,利用內存(甚至是堆外內存)緩存數據,能進行流水線優化,上層封裝了sql、streaming、mlib、graphx等或成熟或不成熟的框架,明顯有取hadoop而代之的傾向。

1. 相同的算法,Spark比Hadoop快數倍,如果是一些迭代或者要對數據反復讀取的算法,Spark比Hadoop快數十倍至上百倍

2. Spark對于數據的操作種類更多,對于一些比較特殊的計算需求,比如求兩個集合的交集并集,Spark都有函數直接計算,而Hadoop實現這樣的計算無比繁瑣

3. Spark的開發效率比Hadoop高很多

最后,鐘老師對二者的發展趨勢進行了預測,他認為雖然Spark目前還不夠成熟,但是今后一定會代替Hadoop。

標簽: 大數據
主站蜘蛛池模板: 免费国产黄网站在线观看动图 | 亚洲第一福利网站在线观看 | 日韩精品内射视频免费观看 | 一级做a爰片久久毛片唾 | 一区二国产好的精华 | 亚洲精品无码av人在线观看国产 | 真实在线播放 | 国产人成高清在线视频99最全资源 | 色婷婷日日躁夜夜躁 | 精品自拍亚洲一区在线 | 人妻精品无码一区二区三区 | 亚洲国产成人精品无码区 | gv天堂gv无码男同在线观看 | 美女午夜福利4K视频在线观看 | 亚洲精品久久无码AV片软件 | 久久久久久A亚洲欧洲AV | 最新国产福利在线 | 免费无码国产裸体 | 欧美特殊大毛茸茸bbw | 日韩国产人妻一区二区三区 | 国产毛片一区二区精品 | 国产又色又爽又黄的免费 | 国产六月婷婷爱在线观看 | 国产精品成人无码久久久久久 | 在线成人A毛片免费播放 | 中文字幕中文有码在线 | 男人用嘴添女人私密视频 | 乱色欧美激情亚洲欧美激情 | 男女下面一进一出免费视频网站 | 99久久婷婷国产综合精品 | 自拍av一区二区三区 | 久久久国产乱子伦精品作者 | 国产精品久久久一区麻豆最新章节 | 搜黄色一级片 | 国产精品乱子伦xxxx裸 | 在线中文字幕国产 | 国产在线一区二区三区AV | 中美日韩毛片免费观看 | 久热香蕉在线爽青青 | 丁香五月激情综合激情综合激情 | 18禁黄网站禁片免费观看国产 |