本階段開始學習大數(shù)據(jù)技術,課上設置隨堂練習偏多,階段結(jié)束時,基于Hadoop的廣告數(shù)據(jù)倉庫
★★★分布式存儲系統(tǒng):分布式數(shù)據(jù)庫HBase★★★
HBase簡介、優(yōu)缺點、架構(gòu)以及HBase API使用等
實戰(zhàn)部分
搭建Hbase集群、使用Hbase Web UI、使用HBase Shell、利用Java編寫程序在hbase中創(chuàng)建表、利用Java編寫程序向hbase表中寫入和讀取數(shù)據(jù)
項目案例
用戶畫像系統(tǒng)、網(wǎng)絡爬蟲
課程目標
掌握HBase系統(tǒng)架構(gòu),能夠編寫程序讀寫HBase中存儲的數(shù)據(jù)
★★★分布式分析引擎:Hive進階★★★
理論部分
Hive內(nèi)部原理,多計算引擎(Tez與Spark),Hive創(chuàng)建ORC/Parquet表,Hive調(diào)優(yōu)
實戰(zhàn)部分
程序方式訪問Hive、Hive調(diào)優(yōu)演示
課程目標
掌握Hive內(nèi)部原理,了解常見Hive的優(yōu)化方式
★★★交互式查詢引擎Presto★★★
理論部分
Presto基本架構(gòu),Presto與Hive對比,Presto基本使用
實戰(zhàn)部分
Presto集群搭建、Presto使用方式、Presto與Hive性能對比