欧美麻豆久久久久久中文_成年免费观看_男人天堂亚洲成人_中国一级片_动漫黄网站免费永久在线观看_国产精品自产av一区二区三区

中培偉業企業IT內訓課程

您現在的位置：首頁 > 企業內訓 > 大數據 > 大數據計算框架Spark+Storm+Flink

大數據計算框架Spark+Storm+Flink

2022-04-29 11:37:03　|　來源：中培企業IT培訓網

一、培訓簡述
全面掌握大數據Spark、Storm和Flink的理論基礎和實現原理，以及基于大數據架構的數據倉庫的實現，通過具體的實操和練習讓學員全面實戰大數據。通過此次課程培訓，可使學習者獲得如下收益：

數據倉庫的核心概念、數據倉庫與大數據
大數據中心平臺的整體架構
徹底理解Spark為代表的大數據處理引擎的運行機制和原理，包括：
- Spark Core
掌握Spark生態體系架構（原理、安裝、使用），包括：
- Spark Core、Spark SQL、Spark Streaming
- Spark Shell、Spark集群、RDD
掌握Spark、Hadoop協同工作，能夠通過Spark、Hadoop輕松應對大數據的業務需求；
掌握以實時計算框Storm為代表的大數據實時計算引擎的運行機制和原理，包括：
- Storm的體系架構
- Storm的數據處理流程與編程模型
- 集成Storm實時計算引擎
掌握Flink的生態圈體系架構，包括：
- 了解Flink大數據架構，互聯網企業大數據應用
- 深度了解Flink DataSet API
- 深度了解DataStream API
- 集成Kafka與Flink
- 熟悉Table API
- 大數據安全認證框架Kerberos。

二、培訓特色

PPT+教材+參考資料，理論講解
提供配套的實驗環境
場景+案例+模擬環境，動手實踐
手把手解決問題+解決問題經驗分享。

三、培訓收益

掌握基于大數據的體系架構、管理、部署，以及相應組件的原理和應用場景。
讓學員具備部署基于企業大數據平臺環境的能力。

四、培訓時長
共計4 天，每天6課時

五、培訓大綱

模塊一：大數據實時計算引擎Storm
章	節	練習	學習目標與案例
Storm	大數據實時計算框架簡介 Apache Storm體系結構 Apache Storm的偽分布模式的搭建 Apache Storm的全分布模式和HA Storm的Demo演示 Storm集群在ZooKeeper上保存的數據結構 WordCount數據流動的過程開發自己的Storm的WordCount程序部署和運行Storm任務 Storm任務執行的過程與通信機制流式計算系統的典型的架構與集成Storm 集成Redis 集成HDFS 集成HBase	使用Storm進行大數據的實時計算	掌握Storm的體系架構和功能。掌握大數據實時計算的典型架構京東大數據平臺的架構

模塊二：Spark基礎之Scala編程語言
章	節	練習	學習目標與案例
Scala編程語言	Scala語言基礎 Scala語言的面向對象 Scala語言的函數式編程 Scala中的集合 Scala語言的高級特性	編程Scala程序	掌握Scala編程語言

模塊三：大數據執行引擎Spark Core
章	節	練習	學習目標與案例
Spark Core	什么是Spark？ Spark的體系結構與安裝部署 Spark的主從架構什么是ZooKeeper Spark HA的實現執行Spark Demo程序 Spark運行機制及原理分析 Spark的算子 Spark RDD的高級算子 Spark基礎編程案例 Spark性能診斷和優化案例系統死鎖的診斷和分析系統內存溢出的診斷和分析案例分享基于Spark的大數據平臺架構	搭建Spark環境使用Spark Core處理數據	掌握Spark的體系架構和功能 Spark與Hadoop的對比

模塊四：數據分析引擎Spark SQL
章	節	練習	學習目標與案例
Spark SQL	Spark SQL基礎 Spark SQL簡介基本概念：Datasets和DataFrames 測試數據創建DataFrames DataFrame操作 Global Temporary View 創建Datasets Datasets的操作案例使用數據源通用的Load/Save函數 Parquet文件 JSON Datasets 使用JDBC 使用Hive Table 性能優化在IDEA中開發Spark SQL程序	使用Spark SQL處理數據	掌握Spark SQL的體系架構和功能。典型的大數據分析引擎的對比 Hive Spark SQL Flink SQL

模塊五：流式計算引擎Spark Streaming
章	節	練習	學習目標與案例
Spark Streaming	Spark Streaming基礎 Spark Streaming簡介 Spark Streaming的特點 Spark Streaming的內部結構第一個小案例：NetworkWordCount 開發自己的NetworkWordCount Spark Streaming進階 StreamingContext對象詳解離散流（DStreams）：Discretized Streams DStream中的轉換操作（transformation）窗口操作輸入DStreams和接收器 DStreams的輸出操作 DataFrame和SQL操作緩存/持久化檢查點支持高級數據源 Spark Streaming接收Flume數據 Spark Streaming接收Kafka數據性能優化減少批數據的執行時間設置正確的批容量內存調優	使用Spark Streaming處理數據	掌握Spark Streaming的體系架構和功能典型的大數據實時引擎的對比 Storm Spark Streaming Flink DataStream

模塊六：機器學習MLLib
章	節	練習	學習目標與案例
Spark MLLib	什么是MLLib？ MLLib中的常見算法 MLlib的應用案例：推薦系統的實現基于用戶的協同過濾基于物品的協同過濾基于ALS的協同過濾邏輯回歸算法		掌握電商環境中推薦系統的實現。

模塊七：新一代大數據處理引擎Flink
章	節		練習	學習目標與案例
第3章：Flink的體系架構與部署	Flink簡介 Flink的體系架構 Flink的安裝與部署 Flink的分布式緩存對比：Flink、Storm和Spark Streaming		安裝與部署Flink環境	掌握Flink的體系架構與生態圈組件
第4章：Flink on Yarn的實現	什么是Yarn？與Yarn的體系架構部署Yarn Flink on Yarn的兩種模式內存集中管理模式內存Job管理模式 Flink on Yarn兩種模式的區別		部署Flink on Yarn	理解并掌握Flink on Yarn的兩種模式的特點
第5章：Flink HA的實現	什么是HA？為什么需要HA？大數據分布式協調框架ZooKeeper 什么是ZooKeeper 搭建ZooKeeper環境 ZooKeeper的特性實現分布式鎖部署Flink HA高可用架構環境		部署Flink HA環境	什么是HA？Flink HA的架構
第6章：Flink開發入門	Flink批處理開發 Java版本WordCount Scala版本WordCount Flink流處理開發 Java版本WordCount Scala版本WordCount 使用Flink Scala Shell Flink的并行度分析		搭建Flink開發環境并開發應用程序	掌握基本的Flink API編程
第7章：Flink DataSet API開發	Map、FlatMap與MapPartition Filter與Distinct Join操作笛卡爾積 First-N 外鏈接操作	基于DataSet API開發Flink離線計算應用		掌握常用的Flink DataSet API算子的作用
第8章：Flink DataStreaming API開發	DataSources 基本的數據源示例自定義數據源內置的Connector DataStream Transformation 轉換操作 Data Sinks 集成Flink與Kafka	基于DataSet Stream開發Flink離線計算應用		掌握常用的Flink DataStream API算子的作用
第9章：狀態管理和恢復	狀態：State Keyed State Operator State 檢查點：Checkpoint 檢查點的配置： state backend存儲模式修改State Backend的兩種方式示例 Restart Strategies（重啟策略）	開發應用進行Flink的有狀態計算		理解并掌握Flink的狀態管理機制
第10章：Window和Time	窗口：Window Time Window示例 Count Window示例 Time：時間 WaterMark：水位線 Watermark的原理 Watermark的三種使用情況設置Watermark的核心代碼窗口的allowedLateness			什么是Flink的窗口操作
第11章：Flink Table & SQL	Flink Table & SQL簡介開發Flink Table & SQL程序使用Flink SQL Client	使用Flink SQL分析處理數據		掌握Flink的數據分析模塊

模塊八：大數據安全認證框架
章	節	練習	學習目標與案例
第1章：大數據安全框架	大數據安全問題大數據安全管控措施 Kerberos安全認證機制 Sentry安全授權組件

（注：大綱還可根據需求進行調整）

標簽：大數據大數據Spark 大數據Storm 大數據Flink Storm體系架構 Flink大數據架構

上一篇：DAMA數據管理專業認證
下一篇：大數據建模分析師課程培訓

相關閱讀

近期開班

全國報名服務熱線
400-626-7377
熱門課程咨詢
在線咨詢
微信公眾號
微信號：zpitedu

主站蜘蛛池模板： JAPAN白嫩丰满人妻VIDEOS 精品国产一区二区三区久久久狼 | 老中医吮她的花蒂和奶水视频播放 | 亚洲韩国精品无码一区二区 | 337p日本欧洲亚洲大胆裸体艺术 | 精品国产制服丝袜高跟 | ASS年轻少妇BBWPIC| 國产一二三内射在线看片 | 日本一级在线观看 | 亚洲av色欲色欲www | 又湿又紧又大又爽A视频 | 精品传媒一区二区三区A片亚洲AV综合色区无码专区桃色 | 色偷偷噜噜噜亚洲男人 | JIZZXXXX18国产AV | 亚婷婷洲av久久蜜臀无码 | 人人婷婷人人澡人人爽 | 一本久道久久综合狠狠躁AV | 麻豆影视在线免费观看 | 小蝌蚪视频色版 | 熟妇人妻中文AV无码 | 亚洲av成人无码天堂 | 噼里啪啦动漫在线观看免费 | 亚洲AV成人AV天堂 | 不卡在线观看亚洲视频 | 波多野结衣高清一区二区三区 | 国产精品人妻无码久久久免费看 | 999精品国产人妻无码梦乃爱华 | 大桥久未无码吹潮在线观看 | 亚洲成av人片在www鸭子 | 东京热一精品无码AV | 日日噜噜夜夜爽 | 国产真人无码AV在线观看 | 精品成人一区二区三区四区 | 欧美丰满老妇性猛交 | 伊人久久五月丁香综合中文亚洲 | 加勒比东京热不卡一区二区ai | 在线精品自偷自拍无码 | 日韩欧美a级毛片免费观看天天躁夜夜躁狠狠久久 | 另类国产精品一区二区 | 偷玩朋友的醉酒人妻中文字幕 | 欧美日产国产精品日产 | 亚洲熟妇无码八AV在线播放 |