有監督學習和無監督學習

有監督學習（supervised learning）：

回顧一下，資料探勘大致是說從已有的資料裡面找規律，或者是挖掘出我們感興趣的知識。舉個例子，先給你資料如下：一種動物，會飛，有翅膀，那麼你會想到什麼？答案是鳥。你之所以能夠想到是鳥，原因是你以前見過，或者是小時候老師教給你說，這是是鳥。那麼這和資料探勘有什麼關係呢？當然有關係，如果你輸入了以上關鍵詞（動物，會飛，有翅膀），怎麼讓機器知道這個是鳥呢？答案是不可能，除非你提前告訴計算機，說一種動物，會飛，有翅膀，這就是鳥。這個“告訴“的過程叫做打標籤（labelling），這個就和小時候老師教你的過程一模一樣。

那麼重點來了，什麼是有監督學習（supervised learning）？用有標籤（label）的資料來做資料探勘的過程，叫做監督學習。當然這裡”做資料探勘“這個說法很抽象，有功底的同學都知道這個過程和機器學習有密不可分的聯絡，但是如果你是初學者，那麼就記住：

有標籤的就是有監督學習，反之無標籤的就是無監督學習(unsupervised learning)

，這個後面我會提到。我後面的文章也會讓你對有監督學習和無監督學習有進一步的認識。

看到這裡你也許會問，怎麼樣給這些關鍵詞打標籤（labelling ）呢？很簡單，你把資料存資料庫的時候分2個欄位，前面的欄位存關鍵詞，後面的欄位存標籤。如果你不存資料庫，其他的情況也是同理，想辦法把關鍵詞和標籤對應起來就行了。具體他們怎麼用，同樣不是這一章節的內容，後面我一定會提到。這裡你只需要知道什麼是有監督學習和無監督學習。

無監督學習（unsupervised learning）：

這裡就不多廢話了

，無監督學習就是在不需要給資料打標籤的基礎上，做資料探勘

。無監督學習主要體現在聚類（

clustering

）上。例子：很多小雞和兔子被關在同一個籠子裡面，我們現在按腳分類，2只腳的分一類，4只腳的分一類。現在新進來了一個動物，4只腳的，我們則很自覺的把它和兔子歸為一類。你看我沒有給資料打標籤吧，我卻可以把新進來的動物歸為兔子一類。這就是資料探勘中的無監督學習。

看到這裡有的人又會問了，小雞和兔子難道不是資料的標籤嗎，你這裡是資料明明就是2只腳和4只腳啊！如果看到這裡你能領悟出這一點，那麼恭喜，你本章有監督學習（supervised learning）和無監督學習（unsupervised learning）畢業了。上面我說小雞和兔子是為了舉例子，按腳分類才是關鍵。其實要判別進來的是4只腳的動物是兔子，的確用的是有監督學習。但是僅僅是為了分類，不在乎是兔還是雞，那麼這就是無監督學習。

轉載請標明出處：https：//www。zhihu。com/people/weiweicai

小蜜蜂問答

小蜜蜂問答

有監督學習和無監督學習

推薦文章

小蜜蜂問答

小蜜蜂問答

有監督學習和無監督學習

相關文章

learn的動詞？

駕考寶典學法減分有用嗎？

為什麼學生專供的學生飲用奶的營養成分表裡都沒標著有鈣呢？

三文魚行業標準？

推薦文章