機器學習(Machine Learning)&深度學習(Deep Learning)資料

《Brief History of Machine Learning》

介紹：這是一篇介紹機器學習歷史的文章，介紹很全面，從感知機、神經網路、決策樹、SVM、Adaboost到隨機森林、Deep Learning。

《Deep Learning in Neural Networks： An Overview》

介紹：這是瑞士人工智慧實驗室Jurgen Schmidhuber寫的最新版本《神經網路與深度學習綜述》本綜述的特點是以時間排序，從1940年開始講起，到60-80年代，80-90年代，一直講到2000年後及最近幾年的進展。涵蓋了deep learning裡各種tricks，引用非常全面。

《A Gentle Introduction to Scikit-Learn： A Python Machine Learning Library》

介紹：這是一份python機器學習庫，如果您是一位python工程師而且想深入的學習機器學習。那麼這篇文章或許能夠幫助到你。

《How to Layout and Manage Your Machine Learning Project》

介紹：這一篇介紹如果設計和管理屬於你自己的機器學習專案的文章，裡面提供了管理模版、資料管理與實踐方法。

《Machine Learning is Fun！》

介紹：如果你還不知道什麼是機器學習，或則是剛剛學習感覺到很枯燥乏味。那麼推薦一讀。這篇文章已經被翻譯成中文，如果有興趣可以移步有趣的機器學習：最簡明入門指南 - 文章 - 伯樂線上

《R語言參考卡片》

介紹：R語言是機器學習的主要語言，有很多的朋友想學習R語言，但是總是忘記一些函式與關鍵字的含義。那麼這篇文章或許能夠幫助到你

《Choosing a Machine Learning Classifier》

介紹：我該如何選擇機器學習演算法，這篇文章比較直觀的比較了Naive Bayes，Logistic Regression，SVM，決策樹等方法的優劣，另外討論了樣本大小、Feature與Model權衡等問題。此外還有已經翻譯了的版本：如何選擇機器學習演算法 - 我愛機器學習

《An Introduction to Deep Learning： From Perceptrons to Deep Networks》

介紹：深度學習概述：從感知機到深度網路，作者對於例子的選擇、理論的介紹都很到位，由淺入深。翻譯版本：深度學習概述：從感知機到深度網路 - xiaowanyer - 部落格園

《The LION Way： Machine Learning plus Intelligent Optimization》

介紹：<機器學習與最佳化>這是一本機器學習的小冊子，短短300多頁道盡機器學習的方方面面。圖文並茂，生動易懂，沒有一坨坨公式的煩惱。適合新手入門打基礎，也適合老手溫故而知新。比起MLAPP/PRML等大部頭，也許這本你更需要！具體內容推薦閱讀：

http：//

intelligent-optimization。org

/LIONbook/

《深度學習與統計學習理論》

介紹：作者是來自百度，不過他本人已經在2014年4月份申請離職了。但是這篇文章很不錯如果你不知道深度學習與支援向量機/統計學習理論有什麼聯絡？那麼應該立即看看這篇文章。

《計算機科學中的數學》

介紹：這本書是由谷歌公司和MIT共同出品的計算機科學中的數學：Mathematics for Computer Science，Eric Lehman et al 2013 。分為5大部分：1）證明，歸納。2）結構，數論，圖。3）計數，求和，生成函式。4）機率，隨機行走。5）遞迴。等等

《資訊時代的計算機科學理論（Foundations of Data Science）》

介紹：資訊時代的計算機科學理論，目前國內有紙質書購買，iTunes購買

《Data Science with R》

介紹：這是一本由雪城大學新編的第二版《資料科學入門》教材：偏實用型，淺顯易懂，適合想學習R語言的同學選讀。

《Twenty Questions for Donald Knuth》

介紹：這並不是一篇文件或書籍。這是篇向圖靈獎得主Donald Knuth提問記錄稿：近日， Charles Leiserson， Al Aho， Jon Bentley等大神向Knuth提出了20個問題，內容包括TAOCP，P/NP問題，圖靈機，邏輯，以及為什麼大神不用電郵等等。

《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》

介紹：不會統計怎麼辦？不知道如何選擇合適的統計模型怎麼辦？那這篇文章你的好好讀一讀了麻省理工Joshua B。 Tenenbaum和劍橋Zoubin Ghahramani合作，寫了一篇關於automatic statistician的文章。可以自動選擇迴歸模型類別，還能自動寫報告。。。

《ICLR 2014論文集》

介紹：對深度學習和representation learning最新進展有興趣的同學可以瞭解一下

《Introduction to Information Retrieval》

介紹：這是一本資訊檢索相關的書籍，是由斯坦福Manning與谷歌副總裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受歡迎的資訊檢索教材之一。最近作者增加了該課程的幻燈片和作業。IR相關資源：Information Retrieval Resources

《Machine learning in 10 pictures》

介紹eniz Yuret用10張漂亮的圖來解釋機器學習重要概念：1。 Bias/Variance Tradeoff 2。 Overfitting 3。 Bayesian / Occam‘s razor 4。 Feature combination 5。 Irrelevant feature 6。 Basis function 7。 Discriminative / Generative 8。 Loss function 9。 Least squares 10。 Sparsity。很清晰

《雅虎研究院的資料集彙總》

介紹：雅虎研究院的資料集彙總：包括語言類資料，圖與社交類資料，評分與分類資料，計算廣告學資料，影象資料，競賽資料，以及系統類的資料。

《An Introduction to Statistical Learning with Applications in R》

介紹：這是一本斯坦福統計學著名教授Trevor Hastie和Robert Tibshirani的新書，並且在2014年一月已經開課：Statistical Learning

Best Machine Learning Resources for Getting Started

介紹：機器學習最佳入門學習資料彙總是專為機器學習初學者推薦的優質學習資源，幫助初學者快速入門。而且這篇文章的介紹已經被翻譯成中文版。如果你不怎麼熟悉，那麼我建議你先看一看中文的介紹。

My deep learning reading list

介紹：主要是順著Bengio的PAMI review的文章找出來的。包括幾本綜述文章，將近100篇論文，各位山頭們的Presentation。全部都可以在google上找到。

Cross-Language Information Retrieval

介紹：這是一本書籍，主要介紹的是跨語言資訊檢索方面的知識。理論很多

探索推薦引擎內部的秘密，第 1 部分：推薦引擎初探

介紹：本文共有三個系列，作者是來自IBM的工程師。它主要介紹了推薦引擎相關演算法，並幫助讀者高效的實現這些演算法。探索推薦引擎內部的秘密，第 2 部分：深度推薦引擎相關演算法 - 協同過濾，探索推薦引擎內部的秘密，第 3 部分：深度推薦引擎相關演算法 - 聚類

《Advice for students of machine learning》

介紹：康奈爾大學資訊科學系助理教授David Mimno寫的《對機器學習初學者的一點建議》，寫的挺實際，強調實踐與理論結合，最後還引用了馮 • 諾依曼的名言： “Young man， in mathematics you don’t understand things。 You just get used to them。”

分散式並行處理的資料

介紹：這是一本關於分散式並行處理的資料《Explorations in Parallel Distributed Processing： A Handbook of Models， Programs， and Exercises》，作者是斯坦福的James L。 McClelland。著重介紹了各種神級網路演算法的分散式實現，做Distributed Deep Learning 的童鞋可以參考下

《“機器學習”是什麼？》

介紹：【“機器學習”是什麼？】John Platt是微軟研究院傑出科學家，17年來他一直在機器學習領域耕耘。近年來機器學習變得炙手可熱，Platt和同事們遂決定開設部落格，向公眾介紹機器學習的研究進展。機器學習是什麼，被應用在哪裡？來看Platt的這篇博文

《2014年國際機器學習大會ICML 2014 論文》

介紹：2014年國際機器學習大會（ICML）已經於6月21-26日在國家會議中心隆重舉辦。本次大會由微軟亞洲研究院和清華大學聯手主辦，是這個有著30多年曆史並享譽世界的機器學習領域的盛會首次來到中國，已成功吸引海內外1200多位學者的報名參與。乾貨很多，值得深入學習下

《Machine Learning for Industry： A Case Study》

介紹：這篇文章主要是以Learning to Rank為例說明企業界機器學習的具體應用，RankNet對NDCG之類不敏感，加入NDCG因素後變成了LambdaRank，同樣的思想從神經網路改為應用到Boosted Tree模型就成就了LambdaMART。Chirs Burges，微軟的機器學習大神，Yahoo 2010 Learning to Rank Challenge第一名得主，排序模型方面有RankNet，LambdaRank，LambdaMART，尤其以LambdaMART最為突出，代表論文為： From RankNet to LambdaRank to LambdaMART： An Overview此外，Burges還有很多有名的代表作，比如：A Tutorial on Support Vector Machines for Pattern Recognition

Some Notes on Applied Mathematics for Machine Learning

100 Best GitHub： Deep Learning

介紹：100 Best GitHub： Deep Learning

《UFLDL-斯坦福大學Andrew Ng教授“Deep Learning”教程》

介紹：本教程將闡述無監督特徵學習和深度學習的主要觀點。透過學習，你也將實現多個功能學習/深度學習演算法，能看到它們為你工作，並學習如何應用/適應這些想法到新問題上。本教程假定機器學習的基本知識（特別是熟悉的監督學習，邏輯迴歸，梯度下降的想法），如果你不熟悉這些想法，我們建議你去這裡機器學習課程，並先完成第II，III，IV章（到邏輯迴歸）。此外這關於這套教程的原始碼在github上面已經有python版本了UFLDL Tutorial Code

*《Deep Learning for Natural Language Processing and Related Applications》

介紹：這份文件來自微軟研究院，精髓很多。如果需要完全理解，需要一定的機器學習基礎。不過有些地方會讓人眼前一亮，茅塞頓開。

Understanding Convolutions

介紹：這是一篇介紹影象卷積運算的文章，講的已經算比較詳細的了

《Machine Learning Summer School》

介紹：每天請一個大牛來講座，主要涉及機器學習，大資料分析，平行計算以及人腦研究。

https：//www。

youtube。com/user/smolix

（需翻牆）

《Awesome Machine Learning》

介紹：一個超級完整的機器學習開源庫總結，如果你認為這個碉堡了，那後面這個列表會更讓你驚訝：【Awesome Awesomeness】，國內已經有熱心的朋友進行了翻譯中文介紹，機器學習資料探勘免費電子書

斯坦福《自然語言處理》課程影片

介紹：ACL候任主席、斯坦福大學計算機系Chris Manning教授的《自然語言處理》課程所有影片已經可以在斯坦福公開課網站上觀看了（如Chrome不行，可用IE觀看）作業與測驗也可以下載。

《Deep Learning and Shallow Learning》

介紹：對比 Deep Learning 和 Shallow Learning 的好文，來著浙大畢業、MIT 讀博的 Chiyuan Zhang 的部落格。

《Recommending music on Spotify with deep learning》

介紹：利用卷積神經網路做音樂推薦。

《Neural Networks and Deep Learning》

介紹：神經網路的免費線上書，已經寫了三章了，還有對應的開原始碼：mnielsen/neural-networks-and-deep-learning 愛好者的福音。

《Java Machine Learning》

介紹：Java機器學習相關平臺和開源的機器學習庫，按照大資料、NLP、計算機視覺和Deep Learning分類進行了整理。看起來挺全的，Java愛好者值得收藏。

《Machine Learning Theory： An Introductory Primer》

介紹：機器學習最基本的入門文章，適合零基礎者

《機器學習常見演算法分類彙總》

介紹：機器學習的演算法很多。很多時候困惑人們都是，很多演算法是一類演算法，而有些演算法又是從其他演算法中延伸出來的。這裡，我們從兩個方面來給大家介紹，第一個方面是學習的方式，第二個方面是演算法的類似性。

《機器學習經典論文/survey合集》

介紹：看題目你已經知道了是什麼內容，沒錯。裡面有很多經典的機器學習論文值得仔細與反覆的閱讀。

《機器學習影片庫》

介紹：影片由加州理工學院（Caltech）出品。需要英語底子。

《機器學習經典書籍》

介紹：總結了機器學習的經典書籍，包括數學基礎和算法理論的書籍，可做為入門參考書單。

《16 Free eBooks On Machine Learning》

介紹：16本機器學習的電子書，可以下載下來在pad，手機上面任意時刻去閱讀。不多我建議你看完一本再下載一本。

《A Large set of Machine Learning Resources for Beginners to Mavens》

介紹：標題很大，從新手到專家。不過看完上面所有資料。肯定是專家了

《機器學習最佳入門學習資料彙總》

介紹：入門的書真的很多，而且我已經幫你找齊了。

《Sibyl》

介紹：Sibyl 是一個監督式機器學習系統，用來解決預測方面的問題，比如 YouTube 的影片推薦。

《Neural Network & Text Mining》

介紹：關於（Deep） Neural Networks在 NLP 和 Text Mining 方面一些paper的總結

《前景目標檢測1（總結）》

介紹：計算機視覺入門之前景目標檢測1（總結）

《行人檢測》

介紹：計算機視覺入門之行人檢測

《Deep Learning – important resources for learning and understanding》

介紹：Important resources for learning and understanding 。 Is awesome

《Machine Learning Theory： An Introductory Primer》

介紹：這又是一篇機器學習初學者的入門文章。值得一讀

《Neural Networks and Deep Learning》

介紹：線上Neural Networks and Deep Learning電子書

《Python 網頁爬蟲 & 文字處理 & 科學計算 & 機器學習 & 資料探勘兵器譜》

介紹：python的17個關於機器學習的工具

《神奇的伽瑪函式（上）》

介紹：下集在這裡神奇的伽瑪函式（下）

《分散式機器學習的故事》

介紹：作者王益目前是騰訊廣告演算法總監，王益博士畢業後在google任研究。這篇文章王益博士7年來從谷歌到騰訊對於分佈機器學習的所見所聞。值得細讀

《機器學習提升之道（Level-Up Your Machine Learning）》

介紹：把機器學習提升的級別分為0~4級，每級需要學習的教材和掌握的知識。這樣，給機器學習者提供一個上進的路線圖，以免走彎路。另外，整個網站都是關於機器學習的，資源很豐富。

《Machine Learning Surveys》

介紹：機器學習各個方向綜述的網站

《Deep Learning Reading list》

介紹：深度學習閱資源列表

《Deep Learning： Methods and Applications》

介紹：這是一本來自微的研究員 li Peng和Dong Yu所著的關於深度學習的方法和應用的電子書

《Machine Learning Summer School 2014》

介紹：2014年七月CMU舉辦的機器學習夏季課剛剛結束有近50小時的影片、十多個PDF版幻燈片，覆蓋深度學習，貝葉斯，分散式機器學習，伸縮性等熱點話題。所有13名講師都是牛人：包括大牛Tom Mitchell （他的［機器學習］是名校的常用教材），還有CMU李沐。（1080P高畫質喲）

《Sibyl：來自Google的大規模機器學習系統》

介紹：在今年的IEEE/IFIP可靠系統和網路（DSN）國際會議上，Google軟體工程師Tushar Chandra做了一個關於Sibyl系統的主題演講。 Sibyl是一個監督式機器學習系統，用來解決預測方面的問題，比如YouTube的影片推薦。詳情請閱讀google sibyl

《Building a deeper understanding of images》

介紹：谷歌研究院的Christian Szegedy在谷歌研究院的部落格上簡要地介紹了他們今年參加ImageNet取得好成績的GoogLeNet系統。是關於影象處理的。

《Bayesian network 與python機率程式設計實戰入門》

介紹：貝葉斯學習。如果不是很清可看看機率程式語言與貝葉斯方法實踐

《AMA： Michael I Jordan》

介紹：網友問伯克利機器學習大牛、美國雙料院士Michael I。 Jordan：“如果你有10億美金，你怎麼花？Jordan： ”我會用這10億美金建造一個NASA級別的自然語言處理研究專案。“

《機器學習&資料探勘筆記_16（常見面試之機器學習演算法思想簡單梳理）》

介紹：常見面試之機器學習演算法思想簡單梳理，此外作者還有一些其他的機器學習與資料探勘文章和深度學習文章，不僅是理論還有原始碼。

《文字與資料探勘影片彙總》

介紹：Videolectures上最受歡迎的25個文字與資料探勘影片彙總

《怎麼選擇深度學習的GPUs》

介紹：在Kaggle上經常取得不錯成績的Tim Dettmers介紹了他自己是怎麼選擇深度學習的GPUs，以及個人如何構建深度學習的GPU叢集：

http：//

t。cn/RhpuD1G

《對話機器學習大神Michael Jordan：深度模型》

介紹：對話機器學習大神Michael Jordan

《Deep Learning 和 Knowledge Graph 引爆大資料革命》

介紹：還有２，３部分。Deep Learning 【2，3】

《Deep Learning 教程翻譯》

介紹：是Stanford 教授 Andrew Ng 的 Deep Learning 教程，國內的機器學習愛好者很熱心的把這個教程翻譯成了中文。如果你英語不好，可以看看這個

《Deep Learning 101》

介紹：因為近兩年來，深度學習在媒體界被炒作很厲害（就像大資料）。其實很多人都還不知道什麼是深度學習。這篇文章由淺入深。告訴你深度學究竟是什麼！

《UFLDL Tutorial》

介紹：這是斯坦福大學做的一免費課程（很勉強），這個可以給你在深度學習的路上給你一個學習的思路。裡面提到了一些基本的演算法。而且告訴你如何去應用到實際環境中。中文版

《Toronto Deep Learning Demos》

介紹：這是多倫多大學做的一個深度學習用來識別圖片標籤／圖轉文字的demo。是一個實際應用案例。有原始碼

《Deep learning from the bottom up》

介紹：機器學習模型，閱讀這個內容需要有一定的基礎。

《R工具包的分類彙總》

介紹：（CRAN Task Views， 34種常見任務，每個任務又各自分類列舉若干常用相關工具包）例如：機器學習，自然語言處理，時間序列分析，空間資訊分析，多重變數分析，計量經濟學，心理統計學，社會學統計，化學計量學，環境科學，藥物代謝動力學等

《機器學習常見演算法分類彙總》

介紹：機器學習無疑是當前資料分析領域的一個熱點內容。很多人在平時的工作中都或多或少會用到機器學習的演算法。本文為您總結一下常見的機器學習演算法，以供您在工作和學習中參考。

《Deep Learning（深度學習）學習筆記整理系列》

介紹：很多幹貨，而且作者還總結了好幾個系列。另外還作者還了一個文章導航。非常的感謝作者總結。

Deep Learning（深度學習）學習筆記整理系列之（二）

Deep Learning（深度學習）學習筆記整理系列之（三）

Deep Learning（深度學習）學習筆記整理系列之（四）

Deep Learning（深度學習）學習筆記整理系列之（五）

Deep Learning（深度學習）學習筆記整理系列之（六）

Deep Learning（深度學習）學習筆記整理系列之（七）

DeepLearning（深度學習）學習筆記整理系列之（八）

《Tutorials Session A - Deep Learning for Computer Vision》

介紹：傳送理由：Rob Fergus的用深度學習做計算機是覺的NIPS 2013教程。有mp4， mp3， pdf各種下載他是紐約大學教授，目前也在Facebook工作，他2014年的8篇論文

《FudanNLP》

介紹：FudanNLP，這是一個復旦大學計算機學院開發的開源中文自然語言處理（NLP）工具包 Fudan NLP裡包含中文分詞、關鍵詞抽取、命名實體識別、詞性標註、時間詞抽取、語法分析等功能，對搜尋引擎文字分析等極為有價值。

《Open Sourcing ml-ease》

介紹inkedIn 開源的機器學習工具包，支援單機， Hadoop cluster，和 Spark cluster 重點是 logistic regression 演算法

《機器學習週刊》

介紹：對於英語不好，但又很想學習機器學習的朋友。是一個大的福利。機器學習週刊目前主要提供中文版，還是面向廣大國內愛好者，內容涉及機器學習、資料探勘、並行系統、影象識別、人工智慧、機器人等等。謝謝作者

《線性代數》

介紹：《線性代數》是《機器學習》的重要數學先導課程。其實《線代》這門課講得淺顯易懂特別不容易，如果一上來就講逆序數及羅列行列式性質，很容易讓學生失去學習的興趣。我個人推薦的最佳《線性代數》課程是麻省理工Gilbert Strang教授的課程。課程主頁

《Big-data》

介紹：大資料資料處理資源、工具不完備列表，從框架、分散式程式設計、分散式檔案系統、鍵值資料模型、圖資料模型、資料視覺化、列儲存、機器學習等。很讚的資源彙總。

《machine learning for smart dummies》

介紹：雅虎邀請了一名來自本古裡安大學的訪問學者，製作了一套關於機器學習的系列影片課程。本課程共分為7期，詳細講解了有關SVM， boosting， nearest neighbors， decision trees 等常規機器學習演算法的理論基礎知識。

《Entanglement-Based Quantum Machine Learning》

介紹：應對大資料時代，量子機器學習的第一個實驗 paper 下載

《How a Math Genius Hacked OkCupid to Find True Love》

介紹：Wired雜誌報道了UCLA數學博士Chris McKinlay （圖1）透過大資料手段+機器學習方法破解婚戀網站配對演算法找到真愛的故事，透過Python指令碼控制著12個賬號，下載了婚戀網站2萬女使用者的600萬問題答案，對他們進行了統計抽樣及聚類分析（圖2，3），最後終於收穫了真愛。科技改變命運！

《Underactuated Robotics》

介紹：MIT的Underactuated Robotics於 2014年10月1日開課，該課屬於MIT研究生級別的課程，對機器人和非線性動力系統感興趣的朋友不妨可以挑戰一下這門課程！

《mllib實踐經驗（1）》

介紹：mllib實踐經驗分享

《Google Turns To Deep Learning Classification To Fight Web Spam》

介紹：Google用Deep Learning做的antispam（反垃圾郵件）

《NLP常用資訊資源》

介紹：NLP常用資訊資源* 《NLP常用資訊資源》

《機器學習速查表》

介紹：機器學習速查表

《Best Papers vs。 Top Cited Papers in Computer Science》

介紹：從1996年開始在計算機科學的論文中被引用次數最多的論文

《InfiniTAM：基於深度影象的體資料整合框架》

介紹：把今年的一個ACM Trans。 on Graphics （TOG）論文中的程式碼整理為一個開源的演算法框架，共享出來了。歡迎大家使用。可以實時的採集3D資料、重建出三維模型。Online learning，GPU Random forest，GPU CRF也會後續公開。

《Hacker‘s guide to Neural Networks》

介紹：【神經網路駭客指南】現在，最火莫過於深度學習（Deep Learning），怎樣更好學習它？可以讓你在瀏覽器中，跑起深度學習效果的超酷開源專案ConvNetJS作者karpathy告訴你，最佳技巧是，當你開始寫程式碼，一切將變得清晰。他剛釋出了一本圖書，不斷線上更新

《Building a Production Machine Learning Infrastructure》

介紹：前Google廣告系統工程師Josh Wills 講述工業界和學術界機器學習的異同，大實話

《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》

介紹：使用Neo4j 做電影評論的情感分析。

《DeepLearning。University – An Annotated Deep Learning Bibliography》

介紹：不僅是資料，而且還對有些資料做了註釋。

《A primer on deeping learning》

介紹：深度學習入門的初級讀本

《Machine learning is teaching us the secret to teaching 》

介紹：機器學習教會了我們什麼？

《scikit-learn：用於機器學習的Python模組》

介紹：scikit-learn是在SciPy基礎上構建的用於機器學習的Python模組。

《對話機器學習大神Michael Jordan：解析領域中各類模型》

介紹：喬丹教授（Michael I。 Jordan）教授是機器學習領域神經網路的大牛，他對深度學習、神經網路有著很濃厚的興趣。因此，很多提問的問題中包含了機器學習領域的各類模型，喬丹教授對此一一做了解釋和展望。

《A*搜尋演算法的視覺化短教程》

介紹：A*搜尋是人工智慧基本演算法，用於高效地搜尋圖中兩點的最佳路徑，核心是 g（n）+h（n）： g（n）是從起點到頂點n的實際代價，h（n）是頂點n到目標頂點的估算代價。合集

《基於雲的自然語言處理開源專案FudanNLP》

介紹：本專案利用了Microsoft Azure，可以在幾分種內完成NLP on Azure Website的部署，立即開始對FNLP各種特性的試用，或者以REST API的形式呼叫FNLP的語言分析功能

《吳立德《機率主題模型&資料科學基礎》

介紹：現任復旦大學首席教授、計算機軟體博士生導師。計算機科學研究所副所長。內部課程

《機器學習入門資源不完全彙總》

介紹：好東西的乾貨真的很多

《收集從2014年開始深度學習文獻》

介紹：從硬體、影象到健康、生物、大資料、生物資訊再到量子計算等，Amund Tveit等維護了一個DeepLearning。University小專案：收集從2014年開始深度學習文獻，相信可以作為深度學習的起點，github

《EMNLP上兩篇關於股票趨勢的應用論文》

介紹：EMNLP上兩篇關於stock trend 用到了deep model組織特徵；Exploiting Social Relations and Sentiment for Stock Prediction用到了stock network。

《Bengio組（蒙特利爾大學LISA組）深度學習教程》

介紹：作者是深度學習一線大牛Bengio組寫的教程，演算法深入顯出，還有實現程式碼，一步步展開。

《學習演算法的Neural Turing Machine 》

介紹：許多傳統的機器學習任務都是在學習function，不過谷歌目前有開始學習演算法的趨勢。谷歌另外的這篇學習Python程式的Learning to Execute也有相似之處

《Learning to Rank for Information Retrieval and Natural Language Processing》

介紹：作者是華為技術有限公司，諾亞方舟實驗室，首席科學家的李航博士寫的關於資訊檢索與自然語言處理的文章

《Rumor has it： Identifying Misinformation in Microblogs》

介紹：利用機用器學習在謠言的判別上的應用，此外還有兩個。一個是識別垃圾與虛假資訊的paper。還有一個是網路輿情及其分析技術

《R機器學習實踐》

介紹：該課程是網易公開課的收費課程，不貴，超級便宜。主要適合於對利用R語言進行機器學習，資料探勘感興趣的人。

《大資料分析：機器學習演算法實現的演化》

介紹：本章中作者總結了三代機器學習演算法實現的演化：第一代非分散式的，第二代工具如Mahout和Rapidminer實現基於Hadoop的擴充套件，第三代如Spark和Storm實現了實時和迭代資料處理。BIG DATA ANALYTICS BEYOND HADOOP

《影象處理，分析與機器視覺》

介紹：講計算機視覺的四部奇書（應該叫經典吧）之一，另外三本是Hartley的《多圖幾何》、Gonzalez的《數字影象處理》、Rafael C。Gonzalez / Richard E。Woods 的《數字影象處理》

《LinkedIn最新的推薦系統文章Browsemaps》

介紹：裡面基本沒涉及到具體演算法，但作者介紹了CF在LinkedIn的很多應用，以及他們在做推薦過程中獲得的一些經驗。最後一條經驗是應該監控log資料的質量，因為推薦的質量很依賴資料的質量！

《初學者如何查閱自然語言處理（NLP）領域學術資料》

介紹：初學者如何查閱自然語言處理（NLP）領域學術資料

《樹莓派的人臉識別教程》

介紹：用樹莓派和相機模組進行人臉識別

《利用深度學習與大資料構建對話系統》

介紹：如何利用深度學習與大資料構建對話系統

《經典論文Leo Breiman：Statistical Modeling： The Two Cultures 》

介紹：Francis Bach合作的有關稀疏建模的新綜述（書）：Sparse Modeling for Image and Vision Processing，內容涉及Sparsity， Dictionary Learning， PCA， Matrix Factorization等理論，以及在影象和視覺上的應用，而且第一部分關於Why does the l1-norm induce sparsity的解釋也很不錯。

《Reproducing Kernel Hilbert Space》

介紹：RKHS是機器學習中重要的概念，其在large margin分類器上的應用也是廣為熟知的。如果沒有較好的數學基礎，直接理解RKHS可能會不易。本文從基本運算空間講到Banach和Hilbert空間，深入淺出，一共才12頁。

《Hacker’s guide to Neural Networks》

介紹：許多同學對於機器學習及深度學習的困惑在於，數學方面已經大致理解了，但是動起手來卻不知道如何下手寫程式碼。斯坦福深度學習博士Andrej Karpathy寫了一篇實戰版本的深度學習及機器學習教程，手把手教你用Javascript寫神經網路和SVM。

《【語料庫】語料庫資源彙總》

介紹：【語料庫】語料庫資源彙總

《機器學習演算法之旅》

介紹：本文會過一遍最流行的機器學習演算法，大致瞭解哪些方法可用，很有幫助。

《Reproducible Research in Computational Science》

介紹：這個裡面有很多關於機器學習、訊號處理、計算機視覺、深入學習、神經網路等領域的大量原始碼（或可執行程式碼）及相關論文。科研寫論文的好資源

《NYU 2014年的深度學習課程資料》

介紹：NYU 2014年的深度學習課程資料，有影片

《計算機視覺資料集不完全彙總》

介紹：計算機視覺資料集不完全彙總

《Machine Learning Open Source Software》

介紹：機器學習開源軟體

《LIBSVM》

介紹：A Library for Support Vector Machines

《Support Vector Machines》

介紹：資料探勘十大經典演算法之一

《100 Best GitHub： Deep Learning》

介紹：github上面100個非常棒的專案

《加州大學歐文分校（UCI）機器學習資料集倉庫》

介紹：當前加州大學歐文分校為機器學習社群維護著306個數據集。查詢資料集

《Andrej Karpathy個人主頁》

介紹：Andrej Karpathy 是斯坦福大學Li Fei-Fei的博士生，使用機器學習在影象、影片語義分析領域取得了科研和工程上的突破，發的文章不多，但每個都很紮實，在每一個問題上都做到了state-of-art。

《Andrej Karpathy的深度強化學習演示》

介紹：Andrej Karpathy的深度強化學習演示，論文在這裡

《CIKM資料探勘競賽奪冠演算法-陳運文》

介紹：CIKM Cup（或者稱為CIKM Competition）是ACM CIKM舉辦的國際資料探勘競賽的名稱。

《Geoffrey E。 Hinton》

介紹：傑弗裡·埃弗里斯特·辛頓 FRS是一位英國出生的計算機學家和心理學家，以其在神經網路方面的貢獻聞名。辛頓是反向傳播演算法和對比散度演算法的發明人之一，也是深度學習的積極推動者。

《自然語言處理的深度學習理論與實際》

介紹：微軟研究院深度學習技術中心在CIKM2014 上關於《自然語言處理的深度學習理論與實際》教學講座的幻燈片

《用大資料和機器學習做股票價格預測》

介紹：本文基於<支援向量機的高頻限價訂單的動態建模>採用了 Apache Spark和Spark MLLib從紐約股票交易所的訂單日誌資料構建價格運動預測模型。（股票有風險，投資謹慎）GitHub原始碼託管地址。

《關於機器學習的若干理論問題》

介紹：徐宗本院士將於熱愛機器學習的小夥伴一起探討有關於機器學習的幾個理論性問題，並給出一些有意義的結論。最後透過一些例項來說明這些理論問題的物理意義和實際應用價值。

《深度學習在自然語言處理的應用》

介紹：作者還著有《這就是搜尋引擎：核心技術詳解》一書，主要是介紹應用層的東西

《Undergraduate machine learning at UBC》

介紹：機器學習課程

《人臉識別必讀的N篇文章》

介紹：人臉識別必讀文章推薦

《推薦系統經典論文文獻及業界應用》

介紹：推薦系統經典論文文獻

《人臉識別必讀的N篇文章》

介紹：人臉識別必讀文章推薦

《第十二屆中國”機器學習及其應用“研討會PPT》

介紹：第十二屆中國”機器學習及其應用“研討會PPT

《統計機器學習》

介紹：統計學習是關於計算機基於資料構建的機率統計模型並運用模型對資料進行預測和分析的一門科學，統計學習也成為統計機器學習。課程來自上海交通大學

《機器學習導論》

介紹：機器學習的目標是對計算機程式設計，以便使用樣本資料或以往的經驗來解決給定的問題。

《CIKM 2014主題報告的幻燈片》

介紹：CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主題報告的幻燈片， Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track報告的幻燈片

《人工智慧和機器學習領域有趣的開源專案》

介紹：部分中文列表

《機器學習經典演算法詳解及Python實現——基於SMO的SVM分類器》

介紹：此外作者還有一篇元演算法、AdaBoostpython實現文章

《Numerical Optimization： Understanding L-BFGS》

介紹：加州伯克利大學博士Aria Haghighi寫了一篇超讚的數值最佳化博文，從牛頓法講到擬牛頓法，再講到BFGS以及L-BFGS，圖文並茂，還有虛擬碼。強烈推薦。

《簡明深度學習方法概述（一）》

介紹：還有續集簡明深度學習方法概述（二）

《R language for programmers》

介紹：Ｒ語言程式設計師私人定製版

《谷歌地圖解密：大資料與機器學習的結合》

介紹：谷歌地圖解密

《空間資料探勘常用方法》

介紹：空間資料探勘常用方法

《Use Google‘s Word2Vec for movie reviews》

介紹：Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學邊用word2vec和deep learning做NLP“ 裡面全套教程教一步一步用python和gensim包的word2vec模型，並在實際比賽裡面比調引數和清資料。如果已裝過gensim不要忘升級

《PyNLPIR》

介紹yNLPIR提供了NLPIR/ICTCLAS漢語分詞的Python介面，此外Zhon提供了常用漢字常量，如CJK字元和偏旁，中文標點，拼音，和漢字正則表示式（如找到文字中的繁體字）

《深度卷積神經網路下圍棋》

介紹：這文章說把最近模型識別上的突破應用到圍棋軟體上，打16萬張職業棋譜訓練模型識別功能。想法不錯。訓練後目前能做到不用計算，只看棋盤就給出下一步，大約10級棋力。但這篇文章太過樂觀，說什麼人類的最後一塊堡壘馬上就要跨掉了。話說得太早。不過，如果與別的軟體結合應該還有潛力可挖。@萬精油墨綠

《NIPS審稿實驗》

介紹：UT Austin教授Eric Price關於今年NIPS審稿實驗的詳細分析，他表示，根據這次實驗的結果，如果今年NIPS重新審稿的話，會有一半的論文被拒。

《2014年最佳的大資料，資料科學文章》

介紹：KDNuggets分別總結了2014年14個閱讀最多以及分享最多的文章。我們從中可以看到多個主題——深度學習，資料科學家職業，教育和薪酬，學習資料科學的工具比如R和Python以及大眾投票的最受歡迎的資料科學和資料探勘語言

《機器學習經典演算法詳解及Python實現——線性迴歸（Linear Regression）演算法》

介紹ython實現線性迴歸，作者還有其他很棒的文章推薦可以看看

《2014中國大資料技術大會33位核心專家演講PDF》

介紹：2014中國大資料技術大會33位核心專家演講PDF下載

《使用RNN和Paragraph Vector做情感分析》

介紹：這是T。 Mikolov & Y。 Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ，使用RNN和PV在情感分析效果不錯，［專案程式碼］（https：//github。com/mesnilgr/iclr15）公佈在github（目前是空的）。這意味著Paragraph Vector終於揭開面紗了嘛。

《NLPIR/ICTCLAS2015分詞系統大會上的技術演講》

介紹：NLPIR/ICTCLAS2015分詞系統釋出與使用者交流大會上的演講，請更多朋友檢閱新版分詞吧。我們實驗室同學的演講包括：孫夢姝-基於評論觀點挖掘的商品搜尋技術研究李然-主題模型

《Machine Learning is Fun！》

介紹：Convex Neural Networks 解決維數災難

《CNN的反向求導及練習》

介紹：介紹CNN引數在使用bp演算法時該怎麼訓練，畢竟CNN中有卷積層和下采樣層，雖然和MLP的bp演算法本質上相同，但形式上還是有些區別的，很顯然在完成CNN反向傳播前瞭解bp演算法是必須的。此外作者也做了一個資源集：機器學習，深度學習，視覺，數學等

《正則表示式最佳化成Trie樹》

介紹：如果要在一篇文章中匹配十萬個關鍵詞怎麼辦？Aho-Corasick 演算法利用添加了返回邊的Trie樹，能夠線上性時間內完成匹配。但如果匹配十萬個正則表示式呢？這時候可以用到把多個正則最佳化成Trie樹的方法，如日本人寫的 Regexp：：Trie

《Deep learning Reading List》

介紹：深度學習閱讀清單

《Caffe》

介紹：Caffe是一個開源的深度學習框架，作者目前在google工作，作者主頁Yangqing Jia （賈揚清）

《GoogLeNet深度學習模型的Caffe復現》

介紹：2014 ImageNet冠軍GoogLeNet深度學習模型的Caffe復現模型，GoogleNet論文。

《LambdaNet，Haskell實現的開源人工神經網路庫》

介紹ambdaNetLambdaNet是由Haskell實現的一個開源的人工神經網路庫，它抽象了網路建立、訓練並使用了高階函式。該庫還提供了一組預定義函式，使用者可以採取多種方式組合這些函式來操作現實世界資料。

小蜜蜂問答

小蜜蜂問答

機器學習(Machine Learning)&深度學習(Deep Learning)資料

推薦文章

小蜜蜂問答

小蜜蜂問答

機器學習(Machine Learning)&深度學習(Deep Learning)資料

相關文章

有待學習什麼意思？

高壓泵不出水怎麼辦？

你最喜歡立秋吃什麼樣的吃食？分享一下吧？

deep one 語錄？

推薦文章