資料分析老司機給新人們的四點建議

作者：

brucelu

大資料、資料倉庫、資料探勘均有涉獵

https：//

ask。hellobi。com/blog/mu

sper

曾經面試過很多家公司，面試過很多崗位，如今沉澱一下仔細想想，有很多地方可以給一些建議，這一篇寫給想入門、想轉行的同學。

一、職業方向

談面試之前，先聊聊資料的職業方向如何，大資料方向根據目前的行業情況主要有：

1、崗位：資料分析師（BI/BA）

方向：資料分析、運營、商業分析

2、崗位：資料開發工程師（大資料開發）

方向：報表開發、模型設計、ETL、技術支援

3、崗位：平臺開發工程師（負責平臺運維開發）

方向：資料平臺開發、運維、工具開發

4、崗位：資料產品經理（資料方向）

方向：產品設計、推廣、需求對接

5、崗位：資料探勘工程師（演算法工程師）

方向：演算法實現、演算法改良、資料應用

6、崗位：機器學習、人工智慧（高階方向）

方向：人工智慧應用、影象、語音、文字等方向

以上幾個崗位（5、6一般都要求研究生學歷，有些會要求985、211），大家熟悉的話，應該也能自己理出來，每個崗位都有細分，比如資料開發工程師下面會細分：ETL、模型設計、報表開發等。很多人都知道現在大資料相關職業賺錢，所以大家都想入行，入行前你可以參考上面的崗位選擇自己對應的方向。

二、優劣及選擇

選擇方向之前，再三確認一下，你是否喜歡這個方向？想做這行嗎？如果答案是確定的話，那麼你可以考慮入行了，要說入行不得不先說兩個詞：

專業壁壘和行業壁壘（學歷壁壘暫時不談）

。

專業壁壘：

一般來說崗位招聘都會寫一個要求：專業為計算機、數學、統計學等相關專業，有這個要求並不奇怪，因為經過大學這幾年的培養，這類專業的人相對其他專業的人有優勢，企業培養這個方向的人成本低，會優先考慮這一類人。

行業壁壘：

就拿金融和網際網路來說，招聘時會帶有行業色彩，一般來說跨行進入的人員不會太受歡迎，所以互金的人很吃香。

如果你不存在這些壁壘，那麼恭喜你，比其他起點高。如果你存在這些壁壘，那麼也不要氣餒，後期學習更重要。

以我自身為例，本科學過c、學過sql，再說我是統計學出身，那我覺得我入行資料分析沒問題，考考我sql我可以過，至於後來為啥轉開發了，因為部門缺開發（淚奔，被迫的~）。

那麼如果你不是科班，也沒有學過sql程式設計怎麼辦？那麼你可以選擇：1、網路課程，2、面授班進行學習，有一定的基礎這是前提，學習過程一定要能匹配崗位要求，現在的課程基本也是匹配崗位要求的，如果心裡沒底，那麼你可以看第三項職位簡述。一般網路課程是自我驅動，面授班都是被金錢驅動的多，自己邊學邊實踐，到火候了就可以多投幾家公司開始試試水，好好準備面試，不要慫，一定要把自己學習能力、積極向上的一面表現出來。

在此說一句良心話，所有的學習不如實踐來的重要，所有的面試都會看重這一點，有機會盡量在工作中實踐，入門前自己多搭環境自己實踐，不要被自己的學習所框住，學的東西只有在用的時候才知道什麼時候不行，什麼時候能行！

三、職位簡述

做好了準備，明確了自己的選擇方向，那麼就可以好好準備你的職業成長方向了，找幾個大公司的招聘JD（職位介紹），會細分到崗位裡面的具體要求，這些要求其實就是對應這些崗位你所能匹配的能力選項，如果你能到這些選項都匹配，那麼恭喜你，你已經是個牛人了。一般匹配度60%，匹配項3項以上基本就可以開始面試看看了。

這幾個崗位裡面，演算法、機器學習有學歷要求，不是科班難度很大。分析、產品、平臺基本要求工作經驗，資料開發要求學習和程式設計能力，相對而言，1-4這幾個崗位是比較好入門的，後面成長要看學習能力和自我驅動能力。

資料分析：

1、本科及以上學歷，2年以上工作經驗，數學、計算機專業優先；

2、有一定的創新能力，在以往的資料分析、挖掘等工作中有自己獨特的見解；

3、具有較強的邏輯思維能力、資料洞察能力和溝通協調能力，擁有強烈的責任心和團隊合作精神；

4、具有探索精神，從資料中發現價值用以支援決策；

5、擁有電商行業背景、或財務、品類管理背景優先。

資料開發：

1。計算機，軟體等相關專業；具有較強的程式設計能力（Java/Python）；

2。具有海量資料計算，實時流式計算等相關專案經驗；

3。熟練應用Hadoop、Hive、Spark，Storm等大資料相關技術並瞭解其原理；

4。優秀的分析問題和解決問題的能力，能夠把理論成功應用於實踐；

5。有極強的責任心和工作主動性；

6。有資料分析和BI系統研發背景者優先。

資料產品：

1、3年以上網際網路產品相關經驗，其中2年以上大資料產品經驗，對於資料平臺搭建、資料體系建設有實戰經驗以及成熟的思路，可考慮大資料相關研發人員的轉崗；

2、熟練使用Axure、XMind、MindManager、Visio等產品工具，清晰表達產品流程和互動流程；

3、具有較強的邏輯思維能力和溝通能力，對產品設計，產品生命期管理等有成熟的經驗和思路。

4、文字呈現和執行能力強，能夠快速的生成方案；

5、熟悉Hadoop、Java，R、Python、Spark等主流技術，有業務建模和資料探勘經驗者優先；

6、良好的業務理解能力、邏輯思維和溝通能力、跨團隊溝通協調能力；做事積極主動，有較好的自主學習能力；

7、有大規模資料探勘、推薦系統、機器學習的產品設計經驗者優先

資料平臺：

1。兩年以上大資料平臺設計和開發經驗，具備優秀的程式設計能力和良好的開發習慣。

2。具備獨立架構設計、核心開發、測試與運維的能力，有過大規模系統設計和工程實現的經驗。

3。熟悉Spark、Spark SQL和Spark Streaming核心原理；瞭解Hadoop生態元件相關技術，例如Hadoop、Hive、Storm等。

4。精通Java、Scala語言，熟悉Linux 作業系統，熟練使用Python、Shell指令碼語言。

5。具有認真的技術態度，良好的團隊溝通和協作能力。

資料探勘：

1。碩士及以上學歷，計算機科學或數學相關專業畢業；

2 瞭解LR，聚類，分類，神經網路，強化學習等相關機器學習理論和演算法；

3。熟悉linux平臺，掌握C/C++/Java某一種程式語言，具有良好的程式設計習慣和演算法基礎；

4。熟悉hadoop，spark等平臺上面向海量資料的演算法實現及資料分析技能；

5。出色的問題分析及解決能力，能自我驅動，持續面對新挑戰。

機器學習：

1。碩士或博士，應屆生或工作經驗1-3年；

2。計算機、統計、電子、數學、數理統計等相關專業，機器學習/資料探勘/資訊檢索/自然語言處理/統計分析相關背景；

3。掌握常用的分類、迴歸、聚類、預測、關聯規則、序列模式等挖掘演算法，瞭解資料探勘前沿技術；

4。熟練使用一種或多種資料探勘工具，使用python/shell/scala等指令碼語言；

5。具有很強的學習和研究能力，英語熟練，能夠熟練閱讀英文技術資料，積極創新、樂於協作、善於溝通。

四、多交流、勤學習

如果你成功入門，那麼恭喜你，進入了所謂的高薪行業，其實，裡面的坑太多了，那麼你得找幾個群和同行業的我們多交流、多踩坑，那麼慢慢的你會發現你也可以diss人了。

學習不要落下了，推薦幾本書：

1、演算法：資料探勘導論、機器學習、統計學習方法，

2、程式設計：java入門到精深、java程式設計思想、JVM深入淺出

3、資料：快學Scala、深入理解Spark核心思想與原始碼

4、hadoop相關的可以多看看影片

小蜜蜂問答

小蜜蜂問答

資料分析老司機給新人們的四點建議

推薦文章

小蜜蜂問答

小蜜蜂問答

資料分析老司機給新人們的四點建議

相關文章

孩子多大適合去故宮？

微信聊天記錄刪除了，又換了新手機，怎麼找到以前的聊天記錄？

形容領導無能的句子？

大資料分析技術與方法有哪些

推薦文章