機(jī)器視覺識(shí)別是一種計(jì)算機(jī)技術(shù),旨在使計(jì)算機(jī)系統(tǒng)能夠模仿人眼和大腦的功能,識(shí)別、分析和理解圖像和視頻。這項(xiàng)技術(shù)涉及圖像處理、模式識(shí)別、計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)等多個(gè)領(lǐng)域。
機(jī)器視覺識(shí)別用到的方法
機(jī)器視覺識(shí)別涉及到多種方法和技術(shù),以下是幾種常見的方法:
1. Blob分析法(Blob Analysis)
Blob分析法是在計(jì)算機(jī)視覺中用來指代圖像中的具有相似顏色、紋理等特征所組成的一塊連通區(qū)域。Blob分析的過程是將圖像進(jìn)行二值化,分割得到前景和背景,然后進(jìn)行連通區(qū)域檢測(cè),從而得到Blob塊的過程。簡(jiǎn)單來說,Blob分析就是在一塊“光滑”區(qū)域內(nèi),將出現(xiàn)“灰度突變”的小區(qū)域?qū)ふ页鰜?。這種方法適用于背景單一,前景缺陷不區(qū)分類別,識(shí)別精度要求不高的場(chǎng)景。
2. 模板匹配法
模板匹配是一種最原始、最基本的模式識(shí)別方法,研究某一特定對(duì)象物的圖案位于圖像的什么地方,進(jìn)而識(shí)別對(duì)象物。這種方法通過統(tǒng)計(jì)計(jì)算圖像的均值、梯度、距離、方差等特征可以在圖中找到目標(biāo),確定其坐標(biāo)位置。模板匹配法對(duì)于圖像或者模板的變化(如旋轉(zhuǎn)、修改像素等)較為敏感,因此在應(yīng)用時(shí)需要構(gòu)建較完善的模板庫(kù)。
3. 深度學(xué)習(xí)法
深度學(xué)習(xí)的應(yīng)用使檢測(cè)精度和檢測(cè)速度都獲得了改善。自AlexNet在比賽中使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)而大幅度提高了圖像分類的準(zhǔn)確率,便有學(xué)者嘗試將深度學(xué)習(xí)應(yīng)用到目標(biāo)類別檢測(cè)中。進(jìn)入深度學(xué)習(xí)時(shí)代以來,物體檢測(cè)發(fā)展主要集中在兩個(gè)方向:twostage算法如R-CNN系列和onestage算法如YOLO、SSD等。
4. 圖像預(yù)處理
圖像預(yù)處理是機(jī)器視覺識(shí)別中的一個(gè)重要步驟,包括矯正機(jī)器視覺所獲得的圖像目標(biāo),并將噪音等干擾進(jìn)行合理過濾,對(duì)圖像目標(biāo)內(nèi)部的信息開展有效提取。這通常包括圖像的平移、旋轉(zhuǎn)、縮放等操作,以及濾波處理,以去除圖像中的噪音干擾,保留圖像的各項(xiàng)特征。
5. 圖像分割
通過加強(qiáng)圖像分割,能夠提高機(jī)器視覺的圖像目標(biāo)識(shí)別的自動(dòng)化水平,使得圖像目標(biāo)識(shí)別效果更加顯著。圖像分割的方法有很多種,包括閾值分割法、能量最小化分割方法、區(qū)域生長(zhǎng)分割方法等。
6. 特征提取
特征提取是在眾多繁復(fù)的圖像信息當(dāng)中,要提取出符合要求的圖像特征,對(duì)提取技術(shù)的速度與精度要求特別高。描述子的出現(xiàn),有效解決了以上問題,例如,采用SURF描述子對(duì)圖像目標(biāo)特征進(jìn)行識(shí)別,能有效提高圖像目標(biāo)識(shí)別效率和效果,同時(shí)SIFT