1、大數(shù)據(jù)熱點(diǎn)問(wèn)題
2、大數(shù)據(jù)發(fā)展趨勢(shì)
3、大數(shù)據(jù)與云計(jì)算
4、大數(shù)據(jù)挖掘面臨的困難與挑戰(zhàn)
5、服務(wù)產(chǎn)生大數(shù)據(jù),大數(shù)據(jù)即服務(wù)
6、大數(shù)據(jù)管理與數(shù)據(jù)思維
二、“工欲善其事”——分析環(huán)境搭建
1、Python語(yǔ)法快速入門
2、易于實(shí)現(xiàn)的并行編程
3、矩陣工具Numpy
4、高級(jí)數(shù)據(jù)分析包Pandas
三、理解數(shù)據(jù)——數(shù)據(jù)預(yù)處理
1、數(shù)據(jù)清洗:數(shù)據(jù)變換,異常值處理,離散化等
2、了解數(shù)據(jù)分布:數(shù)據(jù)度量
3、數(shù)據(jù)的可視化探索
4、向量的相似性度量
5、對(duì)數(shù)據(jù)進(jìn)行降維:PCA和SVD
四、怎樣自動(dòng)獲取海量數(shù)據(jù)
1、從Web自動(dòng)抓取數(shù)據(jù)
2、網(wǎng)絡(luò)爬蟲(chóng)與面臨的問(wèn)題
3、基于Python的爬蟲(chóng)框架Scrapy
4、數(shù)據(jù)清洗BeautifulSoup
5、爬蟲(chóng)實(shí)例分析——獲取大眾點(diǎn)評(píng)的用戶評(píng)論
五、從大數(shù)據(jù)中淘金——個(gè)性化推薦系統(tǒng)
1、關(guān)聯(lián)規(guī)則
2、K-近鄰算法
3、基于內(nèi)容的推薦
4、基于用戶的推薦
5、怎樣評(píng)價(jià)推薦結(jié)果的有效性
6、案例分析:電影推薦,美食推薦,廣告投放
六、見(jiàn)微知著——基于大數(shù)據(jù)的用戶行為挖掘與分析
1、復(fù)雜網(wǎng)絡(luò)與社會(huì)網(wǎng)絡(luò)
2、社會(huì)網(wǎng)絡(luò)的可視化與Python工具
3、基于社會(huì)網(wǎng)絡(luò)的用戶行為分析
4、微博用戶行為分析
5、案例研討:基于科研合作網(wǎng)絡(luò)的行為分析
七、輔助決策——大數(shù)據(jù)可為決策提供更多的輔助信息
1、決策樹(shù)、貝葉斯網(wǎng)絡(luò)等分類器原理
2、分類器性能評(píng)價(jià)指標(biāo)
3、支持向量機(jī)
4、案例分析:金融信貸分類
5、案例分析:分析用戶評(píng)論以改進(jìn)服務(wù)質(zhì)量
八、大數(shù)據(jù)分析前沿技術(shù)與展望
1、深度學(xué)習(xí)初窺
2、輿情監(jiān)測(cè)
3、大數(shù)據(jù)中的隱私保護(hù)
4、討論與總結(jié)