互聯(lián)網(wǎng)行業(yè)
借助于大數(shù)據(jù)技術(shù),可以分析客戶行為,進(jìn)行商品推薦和針對(duì)性廣告投放。
金融行業(yè)
大數(shù)據(jù)在高頻交易、社交情緒分析和信貸風(fēng)險(xiǎn)分析三大金融創(chuàng)新領(lǐng)域發(fā)揮重大作用。
娛樂行業(yè)
哪種題財(cái)?shù)挠耙曌髌犯邇r(jià)值,明星流量關(guān)注群體等數(shù)據(jù)分析。
物流行業(yè)
利用大數(shù)據(jù)優(yōu)化物流網(wǎng)絡(luò),提高物流效率,降低物流成本。
安全領(lǐng)域
大數(shù)據(jù)技術(shù)構(gòu)建起強(qiáng)大的國(guó)家安全保障體系,企業(yè)可以利用大數(shù)據(jù)抵御網(wǎng)絡(luò)攻擊。
電商行業(yè)
利用數(shù)據(jù)挖掘來了解客戶的內(nèi)在需求,消費(fèi)群體消費(fèi)能力,及客戶體驗(yàn)的不足等等。
能源行業(yè)
利用大數(shù)據(jù)技術(shù)分析用戶用電模式,合理設(shè)計(jì)電力需求響應(yīng)系統(tǒng),確保電網(wǎng)運(yùn)行安全。
汽車行業(yè)
利用大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的無人駕駛汽車,未來將走入我們的生活。
生物醫(yī)學(xué)
大數(shù)據(jù)可以實(shí)現(xiàn)流行病預(yù)測(cè)、智慧醫(yī)療、健康管理,解讀DNA,了解更多的生命奧秘。
餐飲行業(yè)
利用大數(shù)據(jù)實(shí)現(xiàn)餐飲O2O模式,徹底改變傳統(tǒng)餐飲經(jīng)營(yíng)方式。
Hadoop離線計(jì)算
大數(shù)據(jù)概述和Hadoop環(huán)境安裝
云計(jì)算和分布式、大數(shù)據(jù)應(yīng)用場(chǎng)景、分布式文件系統(tǒng)設(shè)計(jì)原理、Hadoop集群環(huán)境的安裝、HDFS的基本操作(命令行)、HDFS的配置文件的核心相關(guān)參數(shù)。
HDFS原理和應(yīng)用
HDFS原理分析、HDFS流程分析、訪問HDFS、分布式日志采集案例。
MapReduce和Yarn
MapReducer原理分析、MapReducer的算法模型、MapReduce和Yarn集群的配置、Yarn模型的運(yùn)行管理機(jī)制、MapReduce的本地運(yùn)行模式。
MapReduce編程案例
流量統(tǒng)計(jì)、匯總排序、訂單分組topN、線段重疊統(tǒng)計(jì)、電影評(píng)分的topN、倒排索引、JOIN算法、MapReduce分布式啟動(dòng)運(yùn)行流程、MapReduce數(shù)據(jù)處理流程、數(shù)據(jù)傾斜。
Hadoop架構(gòu)和源碼分析
數(shù)據(jù)倉庫
Hive
Hive核心機(jī)制、Hive的安裝和運(yùn)行、Hive的DDL操作、SQL語法加強(qiáng)。
Hive加強(qiáng)
Hive數(shù)據(jù)類型、單行函數(shù)、聚合函數(shù)和表生成函數(shù)、Hive案例、窗口函數(shù)、Hive自定義函數(shù)等。
Hadoop生態(tài)圈組件
Flume機(jī)制、Flume安裝和配置、Flume攔截器、Flume高可用、日志采集分類匯總、Sqoop機(jī)制、Sqoop的安裝部署、Sqoop的導(dǎo)入導(dǎo)出案例案例、Azkaban的流調(diào)度器介紹、Azkaban的安裝部署和使用配置等。
HBASE
HBASE概述和核心特點(diǎn)、HBASE原理、HBASE的集群部署、shell客戶端的基本操作、Java操作HBASE、HBASE讀寫操作和流程等。
Storm實(shí)時(shí)計(jì)算
Storm編程入門
Storm概述和原理、Storm的本地和集群模式、Storm的核心組件詳解、Storm的并行運(yùn)算和分組運(yùn)算、Storm集群執(zhí)行過程分析,Storm案例。
Storm架構(gòu)和源碼分析
Storm核心機(jī)制
Ack機(jī)制概述、Storm通信機(jī)制、Storm數(shù)據(jù)分發(fā)機(jī)制。
消息中間件Kafka的使用
KafKa概述和原理、KafKa的集群環(huán)境部署、KafKa的生產(chǎn)者和消費(fèi)者、KafKa分組策略、KafKa配置詳解。
Scala語言
Scala語言基礎(chǔ)、Scala函數(shù)和方法、Scala數(shù)據(jù)結(jié)構(gòu)、Scala面向?qū)ο蟆㈦[式參數(shù)、隱式參數(shù)類型轉(zhuǎn)換、泛型、視圖界定、上下文界定、Akka的RPC通信框架等。
Spark內(nèi)存計(jì)算
Spark入門
Spark原理、Spark架構(gòu)分析、Spark集群安裝、Spark-shell單機(jī)和集群、Spark任務(wù)執(zhí)行流程、Spark程序調(diào)試。
Spark RDD
RDD運(yùn)行架構(gòu)、Transformation操作API、RDD分區(qū)數(shù)據(jù)的讀取、Action操作API、Spark編程案例、自定義排序、Stage切分、Spark整體執(zhí)行流程。
Spark SQL
Spark SQL原理、Spark SQL應(yīng)用場(chǎng)景、Spark SQL性能分析、Spark SQL的案例、Spark SQL函數(shù)。
Spark Streaming
Stream運(yùn)行架構(gòu)、SparkStream原理、Spark Stream和KafKa整合、Spark Stream和Redis的整合等。
Spark架構(gòu)和源碼分析
大數(shù)據(jù)項(xiàng)目
大型日志采集系統(tǒng)、大數(shù)據(jù)綜合項(xiàng)目
升學(xué)機(jī)制:基礎(chǔ)學(xué)習(xí)考核不合格學(xué)員需要重讀基礎(chǔ)班
每日作業(yè):完整作業(yè)體系,鞏固加強(qiáng)所學(xué)知識(shí)
針對(duì)性教學(xué)課程:針對(duì)末位學(xué)員進(jìn)行單獨(dú)學(xué)習(xí)指導(dǎo)
實(shí)時(shí)跟進(jìn)學(xué)習(xí):及時(shí)了解學(xué)員知識(shí)吸收情況
階段考試:檢測(cè)學(xué)員知識(shí)綜合運(yùn)用能力