1、目標(biāo):對(duì)數(shù)據(jù)挖掘建立清晰、正確的認(rèn)識(shí);了解如何對(duì)數(shù)據(jù)進(jìn)行初步的統(tǒng)計(jì)分析,掌握利用報(bào)表、統(tǒng)計(jì)指標(biāo)、可視化圖形對(duì)數(shù)據(jù)進(jìn)行概括性描述;掌握數(shù)據(jù)預(yù)處理的基本技巧,例如數(shù)據(jù)清洗、規(guī)范化轉(zhuǎn)換、連續(xù)值離散化、缺失值的處理;了解數(shù)據(jù)倉(cāng)庫(kù)的基本概念和建設(shè)。
——了解數(shù)據(jù)挖掘基本概念、模型和能解決的問題;
——數(shù)據(jù)挖掘面臨的問題
——統(tǒng)計(jì)分析的基本方法和度量
——數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)倉(cāng)庫(kù)
——數(shù)據(jù)預(yù)處理的方式方法
二、挖掘方法1:
1、目標(biāo):掌握頻繁項(xiàng)集、閉合頻繁項(xiàng)集、關(guān)聯(lián)規(guī)則概念,典型關(guān)聯(lián)規(guī)則挖掘算法,關(guān)聯(lián)規(guī)則挖掘的建模與分析;掌握決策樹分類法,理解預(yù)測(cè)準(zhǔn)確率與過擬合的關(guān)系,能夠構(gòu)建訓(xùn)練集、測(cè)試集,并用學(xué)習(xí)到的分類模型進(jìn)行分類預(yù)測(cè)。
——關(guān)聯(lián)分析算法與模型設(shè)計(jì)
——決策樹算法與模型設(shè)計(jì)
——結(jié)合工具軟件操作
三、挖掘方法2:
1、目標(biāo):理解貝葉斯方法,能夠用工具建立貝葉斯網(wǎng)絡(luò)模型;掌握聚類典型算法k-均值聚、層次聚類和基于密度的聚類,能夠構(gòu)建聚類模型,對(duì)數(shù)據(jù)進(jìn)行有效聚類。
——貝葉斯與貝葉斯網(wǎng)絡(luò)算法與模型設(shè)計(jì)
——典型聚類算法與模型設(shè)計(jì)
——結(jié)合工具軟件操作
四、其他挖掘方法與挖掘前沿技術(shù)
1、目標(biāo):了解多種挖掘算法與技術(shù),了解數(shù)據(jù)挖掘的前沿技術(shù),以利于日后可能的應(yīng)用。
——時(shí)序和序列數(shù)據(jù)的挖掘
——神經(jīng)網(wǎng)絡(luò)分類
——圖挖掘、社會(huì)網(wǎng)絡(luò)挖掘分析與介紹
——其他挖掘技術(shù)
五、挖掘模型建模和實(shí)例分析
1、目標(biāo):了解多個(gè)工具軟件,對(duì)個(gè)工具軟件有總體認(rèn)識(shí),以便恰當(dāng)選擇商業(yè)化的挖掘工具;通過一個(gè)實(shí)例,應(yīng)用挖掘工具逐步、詳細(xì)實(shí)現(xiàn)挖掘工程。
——其他多種挖掘工具的介紹。
——結(jié)合一個(gè)實(shí)例,例如市場(chǎng)營(yíng)銷、證券、電信業(yè)務(wù)、銀行業(yè)務(wù)等,進(jìn)行實(shí)際建模
與挖掘分析。