1、目標(biāo):對數(shù)據(jù)挖掘建立清晰、正確的認識;了解如何對數(shù)據(jù)進行初步的統(tǒng)計分析,掌握利用報表、統(tǒng)計指標(biāo)、可視化圖形對數(shù)據(jù)進行概括性描述;掌握數(shù)據(jù)預(yù)處理的基本技巧,例如數(shù)據(jù)清洗、規(guī)范化轉(zhuǎn)換、連續(xù)值離散化、缺失值的處理;了解數(shù)據(jù)倉庫的基本概念和建設(shè)。
——了解數(shù)據(jù)挖掘基本概念、模型和能解決的問題;
——數(shù)據(jù)挖掘面臨的問題
——統(tǒng)計分析的基本方法和度量
——數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)倉庫
——數(shù)據(jù)預(yù)處理的方式方法
二、挖掘方法1:
1、目標(biāo):掌握頻繁項集、閉合頻繁項集、關(guān)聯(lián)規(guī)則概念,典型關(guān)聯(lián)規(guī)則挖掘算法,關(guān)聯(lián)規(guī)則挖掘的建模與分析;掌握決策樹分類法,理解預(yù)測準(zhǔn)確率與過擬合的關(guān)系,能夠構(gòu)建訓(xùn)練集、測試集,并用學(xué)習(xí)到的分類模型進行分類預(yù)測。
——關(guān)聯(lián)分析算法與模型設(shè)計
——決策樹算法與模型設(shè)計
——結(jié)合工具軟件操作
三、挖掘方法2:
1、目標(biāo):理解貝葉斯方法,能夠用工具建立貝葉斯網(wǎng)絡(luò)模型;掌握聚類典型算法k-均值聚、層次聚類和基于密度的聚類,能夠構(gòu)建聚類模型,對數(shù)據(jù)進行有效聚類。
——貝葉斯與貝葉斯網(wǎng)絡(luò)算法與模型設(shè)計
——典型聚類算法與模型設(shè)計
——結(jié)合工具軟件操作
四、其他挖掘方法與挖掘前沿技術(shù)
1、目標(biāo):了解多種挖掘算法與技術(shù),了解數(shù)據(jù)挖掘的前沿技術(shù),以利于日后可能的應(yīng)用。
——時序和序列數(shù)據(jù)的挖掘
——神經(jīng)網(wǎng)絡(luò)分類
——圖挖掘、社會網(wǎng)絡(luò)挖掘分析與介紹
——其他挖掘技術(shù)
五、挖掘模型建模和實例分析
1、目標(biāo):了解多個工具軟件,對個工具軟件有總體認識,以便恰當(dāng)選擇商業(yè)化的挖掘工具;通過一個實例,應(yīng)用挖掘工具逐步、詳細實現(xiàn)挖掘工程。
——其他多種挖掘工具的介紹。
——結(jié)合一個實例,例如市場營銷、證券、電信業(yè)務(wù)、銀行業(yè)務(wù)等,進行實際建模
與挖掘分析。