必備技能
盡管Hadoop已進(jìn)入第二個(gè)十年,但從最近3-4年開始流行起來。許多軟件公司非常普遍地使用Hadoop集群。這無疑是大數(shù)據(jù)中的大事。有抱負(fù)的專業(yè)人員應(yīng)精通這項(xiàng)技術(shù)。
2、NoSQL:NoSQL數(shù)據(jù)庫(包括Couchbase,MongoDB等)正在替代傳統(tǒng)的SQL數(shù)據(jù)庫(如DB2,Oracle等)。這些分布式NoSQL數(shù)據(jù)庫有助于滿足大數(shù)據(jù)存儲和訪問需求。這通過其數(shù)據(jù)處理能力補(bǔ)充了Hadoop的專業(yè)知識。具有NoSQL專業(yè)知識的專業(yè)人員可以在任何地方找到機(jī)會。
3、數(shù)據(jù)可視化:QlikView,Tableau等數(shù)據(jù)可視化工具可以幫助理解分析工具執(zhí)行的分析。難以掌握所執(zhí)行的復(fù)雜大數(shù)據(jù)技術(shù)和流程,而這正是專業(yè)人員發(fā)揮作用的地方。精通數(shù)據(jù)可視化工具的專業(yè)人士可以獲得在大型組織中發(fā)展自己的職業(yè)的機(jī)會。
4、機(jī)器學(xué)習(xí):數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)是大數(shù)據(jù)的兩個(gè)熱門領(lǐng)域。盡管大數(shù)據(jù)的前景廣闊,但這兩者為該領(lǐng)域做出了重要貢獻(xiàn)。缺乏可以使用機(jī)器學(xué)習(xí)進(jìn)行預(yù)測和規(guī)范分析的專業(yè)人員。這些領(lǐng)域可以幫助開發(fā)推薦,分類和個(gè)性化系統(tǒng)。擁有數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)知識的專業(yè)人員也獲得了豐厚的報(bào)酬。
5、Apache Spark:對于復(fù)雜的技術(shù)(如MapReduce),Spark是一種更直接,更快捷的選擇。無論有沒有Hadoop框架,它最近都非常流行。許多組織正在采用該技術(shù),因此正在尋找具有Spark技能的人員。Spark的內(nèi)存堆棧的興起也使Spark成為高薪工作。
6、定量分析:定量和統(tǒng)計(jì)分析是大數(shù)據(jù)的重要組成部分,因?yàn)樗寂c數(shù)字有關(guān)。統(tǒng)計(jì)和數(shù)學(xué)的背景很有幫助。諸如SAS,SPSS,R等工具的知識也有助于提高您的技能。因此,該行業(yè)需要大量具有定量背景的專業(yè)人員。
7、編程語言:某些通用編程語言可以極大地幫助您獲得競爭優(yōu)勢。這些編程語言包括Java,Python,C,Scala等。甚至對具有數(shù)據(jù)分析經(jīng)驗(yàn)的程序員也有很大的需求。
8、數(shù)據(jù)挖掘:在當(dāng)今的IT世界中,數(shù)據(jù)挖掘已達(dá)到新的高度。擁有數(shù)據(jù)挖掘工具和技術(shù)經(jīng)驗(yàn)的專業(yè)人員需要大數(shù)據(jù)工作。諸如Rapid Miner,Apache Mahout和KNIME之類的數(shù)據(jù)挖掘工具是市場上最搶手的數(shù)據(jù)挖掘技能。
9、解決問題的能力:即使您擁有大數(shù)據(jù)領(lǐng)域中所有工具和技術(shù)的知識,解決問題的能力和創(chuàng)造力也將幫助您很好地執(zhí)行任務(wù)。為有效解決方案而實(shí)施大數(shù)據(jù)技術(shù)將需要專業(yè)人員具備這兩種素質(zhì)。
10、SQL:SQL是一種以數(shù)據(jù)為中心的語言,是大數(shù)據(jù)時(shí)代的基礎(chǔ)。在使用NoSQL等大數(shù)據(jù)技術(shù)時(shí),結(jié)構(gòu)化查詢語言的知識從本質(zhì)上將是程序員的一項(xiàng)額外優(yōu)勢。它也是Hadoop Hive倉庫的重要組成部分。