大數(shù)據(jù)學(xué)什么?其實(shí)我們在學(xué)習(xí)任何一門技術(shù)的時候一定要了解這個技術(shù)是做什么的?自己學(xué)習(xí)的目的是什么?如何開始學(xué)?不然很容易半途而為,最后把自己學(xué)暈了。
一、首先你要知道你學(xué)習(xí)目的是什么?
大數(shù)據(jù)是一門非常專業(yè)的課程,想要深入學(xué)習(xí),那么你要學(xué)習(xí)的東西非常多。所以首先你要清楚,大數(shù)據(jù)學(xué)什么?你想學(xué)習(xí)到什么程度?如果只是拓寬知識面或者提升職業(yè)技能,那么學(xué)習(xí)入門級課程,已經(jīng)可以讓你在工作中使用,比如利用大數(shù)據(jù)進(jìn)行數(shù)據(jù)處理和分析。如果你確定以后要從事大數(shù)據(jù)行業(yè)的工作,那么恐怕你要下一番苦功夫。畢竟如果學(xué)一下就會了,那么大數(shù)據(jù)行業(yè)現(xiàn)在恐怕已經(jīng)被擠破門檻了。
知道了學(xué)習(xí)目的,那么如何開始學(xué)呢?
作為零基礎(chǔ)新手小白,要進(jìn)入一個新的技術(shù)領(lǐng)域,首先心理上要有充分的準(zhǔn)備,因?yàn)閷W(xué)習(xí)是需要足夠的時間和精力投入的。另外關(guān)于學(xué)習(xí)方法,有的人習(xí)慣購買視頻或書籍自學(xué),有的人喜歡跟著老師學(xué)。如果選擇自學(xué),一定要有一個完善的學(xué)習(xí)規(guī)劃?梢远嗬镁W(wǎng)絡(luò)資源,多逛技術(shù)論壇,可以多參考前輩的學(xué)習(xí)路線和方法,結(jié)合自己的實(shí)際情況,作出量化指標(biāo),長期堅持,實(shí)現(xiàn)從量變到質(zhì)變。
但是我個人認(rèn)為除非自控力特別強(qiáng)的人,還是跟著老師學(xué)習(xí)比靠譜,畢竟大數(shù)據(jù)對實(shí)際操作要求的比較高。一方面同學(xué)間可以互相激勵,交流,避免在學(xué)習(xí)中自制力不夠的問題。另一方面,當(dāng)你遇到問題時老師能及時幫你解決,還能節(jié)約時間,避免走彎路。
到底大數(shù)據(jù)學(xué)什么?
1)學(xué)習(xí)一門計算機(jī)的編程語言:建議先學(xué)習(xí)Java或Scala。
2)學(xué)習(xí)計算處理框架:嚴(yán)格來說,這分為離線批處理和流式處理,建議學(xué)習(xí)Flink、Spark Streaming或Kafka Streams中的一個。
3)分布式存儲框架:建議學(xué)習(xí)HDFS。
4)資源調(diào)度框架:建議學(xué)習(xí)YARN。
5)分布式協(xié)調(diào)框架:建議學(xué)習(xí)Zookeeper——太多大數(shù)據(jù)框架都需要它了,比如Kafka, Storm, HBase等。
6)KV數(shù)據(jù)庫:典型的就是memcache和Redis了,特別是Redis簡直是發(fā)展神速,建議學(xué)習(xí)Redis,如果C語言功底好的,最好熟讀源碼,反正源碼也不多。
7)列式存儲數(shù)據(jù)庫:建議學(xué)習(xí)HBASE,這是目前應(yīng)用最廣泛的開源列式存儲。
8)消息隊列:大數(shù)據(jù)工程處理中消息隊列作為“削峰填谷”的主力系統(tǒng)是必不可少的,當(dāng)前該領(lǐng)域內(nèi)的解決方案有很多,包括ActiveMQ,Kafka等。建議學(xué)習(xí)Kafka,不僅僅好找工作,還能觸類旁通進(jìn)一步理解基于備份日志方式的數(shù)據(jù)處理模型。
以上文章由北京優(yōu)就業(yè)IT培訓(xùn)機(jī)構(gòu)課程顧問整理編輯發(fā)布,部分文章來自網(wǎng)絡(luò)內(nèi)容真實(shí)性請自行核實(shí)或聯(lián)系我們,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費(fèi)申請試課。關(guān)注官方微信了解更多:150 3333 6050
免 費(fèi) 申 請 試 課