關於YOLO系列的學習,可以轉到我的另一個專欄,專門以YOLO為核心,全面講解所有的技術細節,並以“入門”為導向,提供原始碼,易上手操作。

OD是一個發展很快的領域,從15年的YOLO-v1到現在的TridentNet,無論是PASCAL VOC還是MSCOCO,mAP這個指標都被不停地往上刷,以至於VOC這個資料集幾乎不會再用來證明自己工作的sota。現在COCO似乎成為了這一領域唯一的benchmark,AP也在不斷地被往上刷(從我18年入坑那會的35左右的AP,到如今50+的AP,發展速度還是很快的,也間接說明了,這一領域也要漸漸趨於一個飽和點/瓶頸點)。

大概也是因為發展這麼快,有關於目標檢測的一個詳實的教材性質的書籍(就我所知)尚為出版。雖然一些有關於深度學習的書籍會提到目標檢測,但也只是概括性地講講基礎概念,然後再“手把手”教你如何使用別人的開原始碼就基本算是“講完了”。即便個別書籍就打著“目標檢測”標題,似乎也不是一個真正意義上的手把手教程。這並不意味著有

投機取巧

之嫌,而是這一領域本身發展迅速,很多新奇的好用的模組、更加清晰的準確的概念不斷被提出,此時做一個“集大成”或許還為時尚早。

因此,這個領域對於新手來說,還是有難度的,這一點我自己深有體會。所以,我想寫一個(侷限於我的水平)儘可能實用的教程,把一些(我認為的)基礎必要的東西拿出來分享,用這些東西咱們一起搭建個簡單的目標檢測網路,幫助新手入門這個領域。如果說OD是一片大海的話,我做的事也不過是在海邊撿撿貝殼。

希望這個粗糙的教程能夠幫助到一些OD的愛好者~

當然,我並不是OD這個領域的多麼厲害的研究者,可以說幾乎我能寫出來的東西也都是在拾人牙慧,並且適當地添加了一些自己的東西。所以,我分享的東西必然有瑕疵在其中,可能我看不到,但我想大家一定會看得到,所以分享出來,也是為了和大家一起交流,在交流中學習,在交流中共同進步,這也是我的目的之一。

YOLOv1的內容已經整合進上面的章節了~

第一章就在這收尾吧,下一章,我們就開始搭建我們自己的網路~