您現在的位置: 18luck新利全站下载 >> 管理信息化>> 大數據>> 資料信息

大數據與分布式計算培訓教材(PPT 65頁)

所屬分類:
大數據
文件大小:
4553 KB
下載地址:
相關資料:
大數據, 分布式, 培訓教材
大數據與分布式計算培訓教材(PPT 65頁)內容簡介
HDFS
常用RAID技術
HDFS係統架構
什麼是HDFS?
HDFS設計目標
不適合HDFS的場景
設計目標
HDFS主要組件的功能
文件
分而治之(Divide and Conquer)
MapReduce
MapReduce:大規模數據處理
MapReduce特性
WordCount
Hive QL – Join
Hive QL – Join in Map Reduce
Spark
Spark生態係統
Spark任務處理流程
Spark SQL
Spark Streaming
GraphX
Tachyon
Spark架構
Spark的基本組件。
Spark運行邏輯
..............................
大數據與分布式計算培訓教材(PPT 65頁)
Baidu
map