機器視覺識別是一種計算機技術(shù),旨在使計算機系統(tǒng)能夠模仿人眼和大腦的功能,識別、分析和理解圖像和視頻。這項技術(shù)涉及圖像處理、模式識別、計算機視覺、計算機圖形學等多個領(lǐng)域。
機器視覺識別用到的方法
機器視覺識別涉及到多種方法和技術(shù),以下是幾種常見的方法:
1. Blob分析法(Blob Analysis)
Blob分析法是在計算機視覺中用來指代圖像中的具有相似顏色、紋理等特征所組成的一塊連通區(qū)域。Blob分析的過程是將圖像進行二值化,分割得到前景和背景,然后進行連通區(qū)域檢測,從而得到Blob塊的過程。簡單來說,Blob分析就是在一塊“光滑”區(qū)域內(nèi),將出現(xiàn)“灰度突變”的小區(qū)域?qū)ふ页鰜怼_@種方法適用于背景單一,前景缺陷不區(qū)分類別,識別精度要求不高的場景。
2. 模板匹配法
模板匹配是一種最原始、最基本的模式識別方法,研究某一特定對象物的圖案位于圖像的什么地方,進而識別對象物。這種方法通過統(tǒng)計計算圖像的均值、梯度、距離、方差等特征可以在圖中找到目標,確定其坐標位置。模板匹配法對于圖像或者模板的變化(如旋轉(zhuǎn)、修改像素等)較為敏感,因此在應(yīng)用時需要構(gòu)建較完善的模板庫。
3. 深度學習法
深度學習的應(yīng)用使檢測精度和檢測速度都獲得了改善。自AlexNet在比賽中使用卷積神經(jīng)網(wǎng)絡(luò)進而大幅度提高了圖像分類的準確率,便有學者嘗試將深度學習應(yīng)用到目標類別檢測中。進入深度學習時代以來,物體檢測發(fā)展主要集中在兩個方向:twostage算法如R-CNN系列和onestage算法如YOLO、SSD等。
4. 圖像預(yù)處理
圖像預(yù)處理是機器視覺識別中的一個重要步驟,包括矯正機器視覺所獲得的圖像目標,并將噪音等干擾進行合理過濾,對圖像目標內(nèi)部的信息開展有效提取。這通常包括圖像的平移、旋轉(zhuǎn)、縮放等操作,以及濾波處理,以去除圖像中的噪音干擾,保留圖像的各項特征。
5. 圖像分割
通過加強圖像分割,能夠提高機器視覺的圖像目標識別的自動化水平,使得圖像目標識別效果更加顯著。圖像分割的方法有很多種,包括閾值分割法、能量最小化分割方法、區(qū)域生長分割方法等。
6. 特征提取
特征提取是在眾多繁復(fù)的圖像信息當中,要提取出符合要求的圖像特征,對提取技術(shù)的速度與精度要求特別高。描述子的出現(xiàn),有效解決了以上問題,例如,采用SURF描述子對圖像目標特征進行識別,能有效提高圖像目標識別效率和效果,同時SIFT