l掌握python數(shù)據(jù)分析核心庫(kù)的使用,如numpy、pandas、matplotlib
l了解常用數(shù)據(jù)分析(挖掘)算法的原理,熟悉機(jī)器學(xué)習(xí)的各個(gè)環(huán)節(jié),并能利用相應(yīng)的算法建模
l熟練使用sk-learn進(jìn)行數(shù)據(jù)挖掘
2.有一定的數(shù)據(jù)基礎(chǔ)
章節(jié) |
主要授課內(nèi)容 |
|
|
Python數(shù)據(jù)分析概述 |
1.?dāng)?shù)據(jù)分析的概念、流程、應(yīng)用場(chǎng)景 2.?dāng)?shù)據(jù)分析常用的工具、python數(shù)據(jù)分析的優(yōu)勢(shì)、常用類庫(kù)的介紹 3.Jupyter Notebook的安裝及使用 |
||
Numpy數(shù)值計(jì)算基礎(chǔ) |
1.ndarray的創(chuàng)建、訪問、常用屬性 2.矩陣的創(chuàng)建 3.通用函數(shù)ufunc 4.廣播機(jī)制 5.?dāng)?shù)學(xué)知識(shí) 6.簡(jiǎn)單統(tǒng)計(jì)分析,讀寫文件、排序、去重、常用統(tǒng)計(jì)函數(shù) |
||
Pandas統(tǒng)計(jì)分析基礎(chǔ) |
1.Series常用操作 2.DataFrame常用操作 3.讀寫不同數(shù)據(jù)源 4.?dāng)?shù)據(jù)過濾與轉(zhuǎn)換 5.時(shí)間序列操作 6.分組與聚合 7.透視與交叉表 |
|
|
利用pandas進(jìn)行數(shù)據(jù)預(yù)處理 |
1.合并數(shù)據(jù),堆疊合并、主鍵合并、重疊合并 2.清洗數(shù)據(jù),處理重復(fù)值、缺失值、異常值的處理 3.標(biāo)準(zhǔn)化數(shù)據(jù),離差標(biāo)準(zhǔn)化、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化、小數(shù)定標(biāo)標(biāo)準(zhǔn)化 4.轉(zhuǎn)化數(shù)據(jù) ,類別型特征處理為啞變量,連續(xù)性特征離散化處理 |
|
|
數(shù)據(jù)可視化 |
1.?dāng)?shù)據(jù)可視化概述 2.常用圖表,如柱狀圖、餅狀圖、直方圖、箱線圖等的介紹 3.matplotlib繪圖基礎(chǔ),如基礎(chǔ)語(yǔ)法、rc參數(shù)、標(biāo)簽刻度、子圖等 4.matplotlib繪圖實(shí)戰(zhàn) 5.pandas繪圖實(shí)戰(zhàn) |
|
|
機(jī)器學(xué)習(xí)與挖掘建模 |
1.機(jī)器學(xué)習(xí)概述 2.機(jī)器學(xué)習(xí)分類 3.機(jī)器學(xué)習(xí)流程 4.機(jī)器學(xué)習(xí)評(píng)估 5.經(jīng)典機(jī)器學(xué)習(xí)算法原理剖析,如 knn、kmeans、樸素貝葉斯、決策樹、線性回歸、邏輯回歸、支持向量機(jī)、關(guān)系分析等 6.關(guān)聯(lián)規(guī)則算法 7.時(shí)序模式 8.物體推薦算法 9.使用sk-learn建模,包括數(shù)據(jù)集劃分、數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型評(píng)估等 |
|
|
數(shù)據(jù)分析與挖掘?qū)崙?zhàn)案例 |
1.招聘網(wǎng)站需求分析 2.航空公司客戶價(jià)值分析 3.財(cái)政收入預(yù)測(cè)分析 4.二手房房?jī)r(jià)分析 |