有監督學習 (supervised learning):

回顧一下,資料探勘大致是說從已有的資料裡面找規律,或者是挖掘出我們感興趣的知識。舉個例子,先給你資料如下: 一種動物,會飛,有翅膀,那麼你會想到什麼?答案是鳥。你之所以能夠想到是鳥,原因是你以前見過,或者是小時候老師教給你說,這是是鳥。那麼這和資料探勘有什麼關係呢?當然有關係,如果你輸入了以上關鍵詞(動物,會飛,有翅膀),怎麼讓機器知道這個是鳥呢?答案是不可能,除非你提前告訴計算機,說一種動物,會飛,有翅膀,這就是鳥。這個“告訴“的過程叫做打標籤(labelling), 這個就和小時候老師教你的過程一模一樣。

那麼重點來了,什麼是有監督學習 (supervised learning)?用有標籤(label)的資料來做資料探勘的過程,叫做監督學習。當然這裡”做資料探勘“這個說法很抽象,有功底的同學都知道這個過程和機器學習有密不可分的聯絡,但是如果你是初學者,那麼就記住:

有標籤的就是有監督學習,反之無標籤的就是無監督學習(unsupervised learning)

,這個後面我會提到。我後面的文章也會讓你對有監督學習和無監督學習有進一步的認識。

看到這裡你也許會問,怎麼樣給這些關鍵詞打標籤(labelling )呢?很簡單,你把資料存資料庫的時候分2個欄位,前面的欄位存關鍵詞,後面的欄位存標籤。如果你不存資料庫,其他的情況也是同理,想辦法把關鍵詞和標籤對應起來就行了。具體他們怎麼用,同樣不是這一章節的內容,後面我一定會提到。這裡你只需要知道什麼是有監督學習和無監督學習。

無監督學習(unsupervised learning):

這裡就不多廢話了

,無監督學習就是在不需要給資料打標籤的基礎上,做資料探勘

。無監督學習主要體現在聚類(

clustering

)上。 例子:很多小雞和兔子被關在同一個籠子裡面,我們現在按腳分類,2只腳的分一類,4只腳的分一類。現在新進來了一個動物,4只腳的,我們則很自覺的把它和兔子歸為一類。你看我沒有給資料打標籤吧,我卻可以把新進來的動物歸為兔子一類。這就是資料探勘中的無監督學習。

看到這裡有的人又會問了,小雞和兔子難道不是資料的標籤嗎,你這裡是資料明明就是2只腳和4只腳啊!如果看到這裡你能領悟出這一點,那麼恭喜,你本章有監督學習(supervised learning)和無監督學習(unsupervised learning) 畢業了。上面我說小雞和兔子是為了舉例子,按腳分類才是關鍵。其實要判別進來的是4只腳的動物是兔子,的確用的是有監督學習。但是僅僅是為了分類,不在乎是兔還是雞,那麼這就是無監督學習。

轉載請標明出處:https://www。zhihu。com/people/weiweicai