作者:

brucelu

大資料、資料倉庫、資料探勘均有涉獵

https://

ask。hellobi。com/blog/mu

sper

曾經面試過很多家公司,面試過很多崗位,如今沉澱一下仔細想想,有很多地方可以給一些建議,這一篇寫給想入門、想轉行的同學。

一、職業方向

談面試之前,先聊聊資料的職業方向如何,大資料方向根據目前的行業情況主要有:

1、崗位:資料分析師(BI/BA)

方向:資料分析、運營、商業分析

2、崗位:資料開發工程師(大資料開發)

方向:報表開發、模型設計、ETL、技術支援

3、崗位:平臺開發工程師(負責平臺運維開發)

方向:資料平臺開發、運維、工具開發

4、崗位:資料產品經理(資料方向)

方向:產品設計、推廣、需求對接

5、崗位:資料探勘工程師(演算法工程師)

方向:演算法實現、演算法改良、資料應用

6、崗位:機器學習、人工智慧(高階方向)

方向:人工智慧應用、影象、語音、文字等方向

以上幾個崗位(5、6一般都要求研究生學歷,有些會要求985、211),大家熟悉的話 ,應該也能自己理出來,每個崗位都有細分,比如資料開發工程師下面會細分:ETL、模型設計、報表開發等。很多人都知道現在大資料相關職業賺錢,所以大家都想入行,入行前你可以參考上面的崗位選擇自己對應的方向。

二、優劣及選擇

選擇方向之前,再三確認一下,你是否喜歡這個方向?想做這行嗎?如果答案是確定的話,那麼你可以考慮入行了,要說入行不得不先說兩個詞:

專業壁壘和行業壁壘(學歷壁壘暫時不談)

專業壁壘:

一般來說崗位招聘都會寫一個要求:專業為計算機、數學、統計學等相關專業,有這個要求並不奇怪,因為經過大學這幾年的培養,這類專業的人相對其他專業的人有優勢,企業培養這個方向的人成本低,會優先考慮這一類人。

行業壁壘:

就拿金融和網際網路來說,招聘時會帶有行業色彩,一般來說跨行進入的人員不會太受歡迎,所以互金的人很吃香。

如果你不存在這些壁壘,那麼恭喜你,比其他起點高。如果你存在這些壁壘,那麼也不要氣餒,後期學習更重要。

以我自身為例,本科學過c、學過sql,再說我是統計學出身,那我覺得我入行資料分析沒問題,考考我sql我可以過,至於後來為啥轉開發了,因為部門缺開發(淚奔,被迫的~)。

那麼如果你不是科班,也沒有學過sql程式設計怎麼辦?那麼你可以選擇:1、網路課程,2、面授班進行學習,有一定的基礎這是前提,學習過程一定要能匹配崗位要求,現在的課程基本也是匹配崗位要求的,如果心裡沒底,那麼你可以看第三項職位簡述。一般網路課程是自我驅動,面授班都是被金錢驅動的多,自己邊學邊實踐,到火候了就可以多投幾家公司開始試試水,好好準備面試,不要慫,一定要把自己學習能力、積極向上的一面表現出來。

在此說一句良心話,所有的學習不如實踐來的重要,所有的面試都會看重這一點,有機會盡量在工作中實踐,入門前自己多搭環境自己實踐,不要被自己的學習所框住,學的東西只有在用的時候才知道什麼時候不行,什麼時候能行!

三、職位簡述

做好了準備,明確了自己的選擇方向,那麼就可以好好準備你的職業成長方向了,找幾個大公司的招聘JD(職位介紹),會細分到崗位裡面的具體要求,這些要求其實就是對應這些崗位你所能匹配的能力選項,如果你能到這些選項都匹配,那麼恭喜你,你已經是個牛人了。一般匹配度60%,匹配項3項以上基本就可以開始面試看看了。

這幾個崗位裡面,演算法、機器學習有學歷要求,不是科班難度很大。分析、產品、平臺基本要求工作經驗,資料開發要求學習和程式設計能力,相對而言,1-4這幾個崗位是比較好入門的,後面成長要看學習能力和自我驅動能力。

資料分析:

1、本科及以上學歷,2年以上工作經驗,數學、計算機專業優先;

2、有一定的創新能力,在以往的資料分析、挖掘等工作中有自己獨特的見解;

3、具有較強的邏輯思維能力、資料洞察能力和溝通協調能力,擁有強烈的責任心和團隊合作精神;

4、具有探索精神,從資料中發現價值用以支援決策;

5、擁有電商行業背景、或財務、品類管理背景優先。

資料開發:

1。計算機,軟體等相關專業;具有較強的程式設計能力(Java/Python);

2。具有海量資料計算,實時流式計算等相關專案經驗;

3。熟練應用Hadoop、Hive、Spark,Storm等大資料相關技術並瞭解其原理;

4。優秀的分析問題和解決問題的能力,能夠把理論成功應用於實踐;

5。有極強的責任心和工作主動性;

6。有資料分析和BI系統研發背景者優先。

資料產品:

1、3年以上網際網路產品相關經驗,其中2年以上大資料產品經驗,對於資料平臺搭建、資料體系建設有實戰經驗以及成熟的思路,可考慮大資料相關研發人員的轉崗;

2、熟練使用Axure、XMind、MindManager、Visio等產品工具,清晰表達產品流程和互動流程;

3、具有較強的邏輯思維能力和溝通能力,對產品設計,產品生命期管理等有成熟的經驗和思路。

4、文字呈現和執行能力強,能夠快速的生成方案;

5、熟悉Hadoop、Java,R、Python、Spark等主流技術,有業務建模和資料探勘經驗者優先;

6、良好的業務理解能力、邏輯思維和溝通能力、跨團隊溝通協調能力;做事積極主動,有較好的自主學習能力;

7、有大規模資料探勘、推薦系統、機器學習的產品設計經驗者優先

資料平臺:

1。兩年以上大資料平臺設計和開發經驗,具備優秀的程式設計能力和良好的開發習慣。

2。具備獨立架構設計、核心開發、測試與運維的能力,有過大規模系統設計和工程實現的經驗。

3。熟悉Spark、Spark SQL和Spark Streaming核心原理;瞭解Hadoop生態元件相關技術,例如Hadoop、Hive、Storm等。

4。精通Java、Scala語言,熟悉Linux 作業系統,熟練使用Python、Shell指令碼語言。

5。具有認真的技術態度,良好的團隊溝通和協作能力。

資料探勘:

1。碩士及以上學歷,計算機科學或數學相關專業畢業;

2 瞭解LR,聚類,分類,神經網路,強化學習等相關機器學習理論和演算法;

3。熟悉linux平臺,掌握C/C++/Java某一種程式語言,具有良好的程式設計習慣和演算法基礎;

4。熟悉hadoop,spark等平臺上面向海量資料的演算法實現及資料分析技能;

5。出色的問題分析及解決能力,能自我驅動,持續面對新挑戰。

機器學習:

1。碩士或博士,應屆生或工作經驗1-3年;

2。計算機、統計、電子、數學、數理統計等相關專業,機器學習/資料探勘/資訊檢索/自然語言處理/統計分析相關背景;

3。掌握常用的分類、迴歸、聚類、預測、關聯規則、序列模式等挖掘演算法,瞭解資料探勘前沿技術;

4。熟練使用一種或多種資料探勘工具,使用python/shell/scala等指令碼語言;

5。具有很強的學習和研究能力,英語熟練,能夠熟練閱讀英文技術資料,積極創新、樂於協作、善於溝通。

四、多交流、勤學習

如果你成功入門,那麼恭喜你,進入了所謂的高薪行業,其實,裡面的坑太多了,那麼你得找幾個群和同行業的我們多交流、多踩坑,那麼慢慢的你會發現你也可以diss人了。

學習不要落下了,推薦幾本書:

1、演算法:資料探勘導論、機器學習、統計學習方法,

2、程式設計:java入門到精深、java程式設計思想、JVM深入淺出

3、資料:快學Scala、深入理解Spark核心思想與原始碼

4、hadoop相關的可以多看看影片