您現在的位置: 18luck新利全站下载 >> 管理信息化>> 大數據>> 資料信息

大數據與分布式計算介紹(PPT 65頁)

所屬分類:
大數據
文件大小:
1339 KB
下載地址:
相關資料:
大數據, 分布式
大數據與分布式計算介紹(PPT 65頁)內容簡介
大數據與分布式計算
HDFS
常用RAID技術
HDFS係統架構
什麼是HDFS?
HDFS設計目標
不適合HDFS的場景
設計目標
HDFS主要組件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大規模數據處理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意義
Hive架構
Hive執行流程
Hive操作符
Hive編譯器
Spark
Spark生態係統
Spark任務處理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架構
Spark的基本組件。
Spark運行邏輯
..............................
大數據與分布式計算介紹(PPT 65頁)
Baidu
map