目標(biāo)檢測(cè)一直是計(jì)算機(jī)視覺(jué)的基礎(chǔ)問(wèn)題,在 2010 年左右就開(kāi)始停滯不前了。自 2013 年一篇論文的發(fā)表,目標(biāo)檢測(cè)從原始的傳統(tǒng)手工提取特征方法變成了基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取,從此一發(fā)不可收拾。

本文將跟著歷史的潮流,簡(jiǎn)要地探討「目標(biāo)檢測(cè)」算法的兩種思想和這些思想引申出的算法,主要涉及那些主流算法,no bells and whistles.

概述 Overview

在深度學(xué)習(xí)正式介入之前,傳統(tǒng)的「目標(biāo)檢測(cè)」方法都是 區(qū)域選擇、提取特征、分類回歸 三部曲,這樣就有兩個(gè)難以解決的問(wèn)題;其一是區(qū)域選擇的策略效果差、時(shí)間復(fù)雜度高;其二是手工提取的特征魯棒性較差。

云計(jì)算時(shí)代來(lái)臨后,「目標(biāo)檢測(cè)」算法大家族主要?jiǎng)澐譃閮纱笈上担粋€(gè)是 R-CNN 系兩刀流,另一個(gè)則是以 YOLO 為代表的一刀流派。下面分別解釋一下 兩刀流 和 一刀流。

兩刀流

顧名思義,兩刀解決問(wèn)題:

1、生成可能區(qū)域(Region Proposal) & CNN 提取特征
2、放入分類器分類并修正位置

這些算法等離不開(kāi) Region Proposal ,即是優(yōu)點(diǎn)也是缺點(diǎn),主要代表人物就是 R-CNN 系。

一刀流

顧名思義,一刀解決問(wèn)題,直接對(duì)預(yù)測(cè)的目標(biāo)物體進(jìn)行回歸。
回歸解決問(wèn)題簡(jiǎn)單快速,但是太粗暴了,主要代表人物是 YOLO 和 SSD 。

無(wú)論 兩刀流 還是 一刀流,他們都是在同一個(gè)天平下選取一個(gè)平衡點(diǎn)、或者選取一個(gè)極端—— 要么準(zhǔn),要么快。

兩刀流的天平主要傾向準(zhǔn),一刀流的天平主要傾向快。

但最后萬(wàn)劍歸宗,大家也找到了自己的平衡,平衡點(diǎn)的有略微的不同。

接下來(lái)我們花開(kāi)兩朵各表一支,一朵 兩刀流 的前世今生,另一朵 一刀流 的發(fā)展歷史。

兩刀流 R-CNN

R-CNN 其實(shí)是一個(gè)很大的家族,自從 rbg 大神發(fā)表那篇論文,子孫無(wú)數(shù)、桃李滿天下。在此,我們只探討 R-CNN 直系親屬,他們的發(fā)展順序如下:

R-CNN -> SPP Net -> Fast R-CNN -> Faster R-CNN -> Mask R-CNN