項(xiàng)目背景
統(tǒng)計(jì)分析通過對(duì)大數(shù)據(jù)進(jìn)行收集、探索、呈現(xiàn),發(fā)現(xiàn)其中隱藏模式及趨勢,現(xiàn)已滲透于社會(huì)生活的方方面面。制造商通過統(tǒng)計(jì)分析提升織物美觀度及耐用度、優(yōu)化航空工業(yè)生產(chǎn)運(yùn)行;研究人員通過統(tǒng)計(jì)分析處理疫苗研發(fā)數(shù)據(jù),其穩(wěn)定性、安全性;通信公司通過數(shù)據(jù)分析優(yōu)化網(wǎng)絡(luò)資源,提升服務(wù)質(zhì)量,深入了解客戶需求,減少客戶流失;各國依靠統(tǒng)計(jì)數(shù)據(jù)清晰了解國家經(jīng)濟(jì)金融及人口現(xiàn)狀。
項(xiàng)目中,學(xué)生將掌握統(tǒng)計(jì)學(xué)和線性代數(shù)的基本概念,并通過實(shí)踐,學(xué)習(xí)如何將數(shù)學(xué)工具應(yīng)用于數(shù)據(jù)處理中。項(xiàng)目涵蓋的主要理論概念括:概率分布和貝葉斯決策,矩陣的表示和操作,馬爾科夫鏈和結(jié)構(gòu)化統(tǒng)計(jì)關(guān)系,近似推理和簡單的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)等。
個(gè)性化研究課題參考:
運(yùn)用蒙特卡洛模擬法的數(shù)據(jù)流調(diào)度優(yōu)化模型研究
樸素貝葉斯分類器模型改進(jìn)
基于多源遷移學(xué)習(xí)的數(shù)據(jù)校驗(yàn)方法
2、《概率論與統(tǒng)計(jì)學(xué)及其在最優(yōu)化模型中的應(yīng)用》
項(xiàng)目背景
概率論與統(tǒng)計(jì)學(xué)是數(shù)學(xué)一個(gè)極其重要的分支,它研究偶然現(xiàn)象和隨機(jī)現(xiàn)象,以及如何從數(shù)據(jù)中提取有意義的信息。隨著工程、物理、生物和數(shù)據(jù)科學(xué)的應(yīng)用越來越多,這兩門學(xué)科正在迅速成為了解我們生活的世界的基礎(chǔ)。目前,概率統(tǒng)計(jì)理論進(jìn)入其他自然科學(xué)領(lǐng)域的趨勢還在不斷發(fā)展,在社會(huì)科學(xué)領(lǐng)域,特別是經(jīng)濟(jì)學(xué)中研究最優(yōu)決策和經(jīng)濟(jì)的穩(wěn)定增長等問題,都大量采用概率統(tǒng)計(jì)方法。
本項(xiàng)目將提供世界的概率論和統(tǒng)計(jì)學(xué)的現(xiàn)代介紹,將涵蓋概率分布、期望、獨(dú)立性、條件期望和馬爾可夫鏈的基本概念,以及極大似然估計(jì)、置信區(qū)間和假設(shè)檢驗(yàn)的概念。學(xué)生將在項(xiàng)目結(jié)束時(shí),提交項(xiàng)目研究報(bào)告,進(jìn)行成果展示。
個(gè)性化研究課題參考:
線性回歸中自相關(guān)問題在建模中的求解與研究
線性回歸(房價(jià)預(yù)測模型)
基于一元線性回歸的變形監(jiān)測數(shù)據(jù)處理與分析
3、《量子計(jì)算專題:解密未來計(jì)算機(jī)量子力學(xué)規(guī)律及其在加速算法運(yùn)行及密碼破譯中的應(yīng)用》
項(xiàng)目背景
現(xiàn)代計(jì)算機(jī)在過去的幾十年內(nèi)幫助人類解決了許多問題,大幅度解放了勞動(dòng)力。但是,仍有一些問題是現(xiàn)代計(jì)算機(jī)無法處理的。而量子計(jì)算的目標(biāo)就是克服普通計(jì)算機(jī)的瓶頸,解決更多更復(fù)雜的問題。在大數(shù)據(jù)時(shí)代,經(jīng)典計(jì)算機(jī)算法的發(fā)展舉步維艱,即使擁有強(qiáng)大的硬件也無法有效解決很多問題;而量子計(jì)算機(jī)借助量子狀態(tài)、量子糾纏等屬性可快速處理近乎無限多的變量。
括Google和NASA在內(nèi)的眾多國內(nèi)外企業(yè)與科研機(jī)構(gòu)都在量子計(jì)算領(lǐng)域投入了大量科研資金,并于近些年取得了初步成果。在不久的將來,隨著量子計(jì)算機(jī)投入量產(chǎn),其必然會(huì)在網(wǎng)絡(luò)安全、互聯(lián)網(wǎng)搜索和人工智能中擔(dān)任舉足輕重的角色,并深刻改變現(xiàn)代制造業(yè)、服務(wù)業(yè)的各個(gè)領(lǐng)域。
4、《高階:人工智能與數(shù)據(jù)科學(xué):基于計(jì)算數(shù)學(xué)及統(tǒng)計(jì)學(xué)理論的機(jī)器學(xué)習(xí)算法調(diào)參優(yōu)化方法與實(shí)踐》
項(xiàng)目背景
機(jī)器學(xué)習(xí)(ML)和人工智能(AI)兩大主流科技將成為我們社會(huì)未來所依賴的基礎(chǔ)設(shè)施。然而,隨著這些領(lǐng)域的巨大快速增長,越來越多的數(shù)據(jù)科學(xué)家似乎依賴于ML和AI的“黑盒”使用方法。也就是在不了解理論性質(zhì)的情況下,直接應(yīng)用計(jì)算技術(shù)和對(duì)應(yīng)框架。這一令人擔(dān)憂的現(xiàn)象對(duì)數(shù)據(jù)科學(xué)領(lǐng)域的發(fā)展毫無益處,本項(xiàng)目旨在填補(bǔ)這一空白,讓學(xué)生在實(shí)踐的同時(shí)也能深度理解其背后的理論支持。
個(gè)性化研究課題參考:
MSE與MAE對(duì)機(jī)器學(xué)習(xí)性能優(yōu)化的作用比較
機(jī)器學(xué)習(xí)隨機(jī)優(yōu)化方法的個(gè)體收斂性研究
高維因子模型及其在統(tǒng)計(jì)機(jī)器學(xué)習(xí)中的應(yīng)用
5、《統(tǒng)計(jì)學(xué)研究:隨機(jī)過程在建模中的應(yīng)用》
項(xiàng)目背景
數(shù)字時(shí)代到來之后,企業(yè)經(jīng)營的各個(gè)階段都可以被記錄下來,產(chǎn)品銷售的各個(gè)環(huán)節(jié)也被記錄下來,客戶的消費(fèi)行為和網(wǎng)上行為都被采集下來。企業(yè)擁有了多維度的數(shù)據(jù),括產(chǎn)品銷售數(shù)據(jù)、客戶消費(fèi)數(shù)據(jù)、客戶行為數(shù)據(jù)、企業(yè)運(yùn)營數(shù)據(jù)等。
擁有數(shù)據(jù)之后,數(shù)據(jù)分析成為可能,企業(yè)成立了數(shù)據(jù)分析團(tuán)隊(duì)整理數(shù)據(jù)和建立模型,找到商品和客戶之間的關(guān)聯(lián)關(guān)系,商品之間關(guān)聯(lián)關(guān)系,另外也找到了收入和客戶之間的關(guān)聯(lián)關(guān)系。最為著名的數(shù)據(jù)分析案就是沃爾瑪?shù)钠【坪湍虿疾呗裕涸谟袐雰旱拿绹彝ブ?,通常都是由母親在家中照看嬰兒,去超市購買尿布一般由年輕的父親負(fù)責(zé),而他們往往會(huì)順便為自己購買一些啤酒。
而數(shù)據(jù)統(tǒng)計(jì)發(fā)現(xiàn),多數(shù)父親通常有可能會(huì)尋找到一家超市直到可以一次買到啤酒和尿布兩件商品。沃爾瑪?shù)墓芾砣藛T發(fā)現(xiàn)該現(xiàn)象后,立即著手把啤酒與尿布擺放在相同的區(qū)域。其后,為了證明“啤酒+尿布”銷售的可行性。
美國學(xué)者艾格拉沃(Agrawal)在1993年從數(shù)學(xué)及計(jì)算機(jī)算法角度提出了商品關(guān)聯(lián)關(guān)系的計(jì)算方法——Aprior算法,即通過分析購物籃中的商品集合,找到商品之間關(guān)聯(lián)關(guān)系的關(guān)聯(lián)算法,根據(jù)商品之間的關(guān)系,找出顧客的購買行為。在此基礎(chǔ)之上沃爾瑪嘗試將艾格拉沃提出的Aprior算法引入POS機(jī)數(shù)據(jù)分析中,此舉大獲成功。
6、《MIS信息系統(tǒng)管理專題》
項(xiàng)目背景
隨機(jī)過程是隨機(jī)變量的集合,一些基本類型括馬爾可夫過程、泊松過程(如放射性衰變)和時(shí)間序列。物理、工程和社會(huì)動(dòng)力學(xué)中諸多現(xiàn)象都受隨機(jī)過程的支配。使用統(tǒng)計(jì)方法,可以幫助認(rèn)識(shí)上述現(xiàn)象,做出理性決策,管理隨機(jī)過程,優(yōu)化產(chǎn)出和結(jié)果。由于現(xiàn)象和問題往往具有復(fù)雜性,傳統(tǒng)數(shù)學(xué)方法無力應(yīng)對(duì),計(jì)算機(jī)建模和模擬成為了數(shù)理統(tǒng)計(jì)分析、預(yù)測、優(yōu)化中不可或缺的工具。項(xiàng)目將引導(dǎo)學(xué)生圍繞統(tǒng)計(jì)隨機(jī)建模展開探究。
項(xiàng)目內(nèi)容括隨機(jī)數(shù)性質(zhì)與生成、隨機(jī)算法設(shè)計(jì)、算法代碼、統(tǒng)計(jì)預(yù)測、計(jì)算復(fù)雜性與效率、統(tǒng)計(jì)編程語言等。學(xué)生將通過項(xiàng)目運(yùn)用Java編程語言,探究隨機(jī)性、隨機(jī)數(shù)生成及其在復(fù)雜現(xiàn)象模擬中的應(yīng)用,在結(jié)束時(shí)提交項(xiàng)目報(bào)告,進(jìn)行成果展示。
個(gè)性化研究課題參考:
蒙特卡羅粒子輸運(yùn)模擬中基于粒子的并行計(jì)算方法研究
高斯隨機(jī)數(shù)發(fā)生器的研究與設(shè)計(jì)
大數(shù)據(jù)時(shí)代下的統(tǒng)計(jì)學(xué)研究