光學(xué)字符識別(OCR)是工業(yè)環(huán)境中的重要技術(shù)。OCR技術(shù)在辦公室通信中尤為出色。紙張文件(如發(fā)票,發(fā)貨單和其他記錄)的掃描可以將其快速轉(zhuǎn)換為數(shù)字格式,從中提取相關(guān)信息,并將這些數(shù)據(jù)整合到一個連續(xù)的電子信息流中。

字符識別中機(jī)器視覺如何深度學(xué)習(xí)技術(shù)?-機(jī)器視覺_視覺檢測設(shè)備_3D視覺_缺陷檢測

  機(jī)器視覺使得可以基于印刷或沖壓字符可靠地識別整個價值鏈中的工件和產(chǎn)品。借助于現(xiàn)代深度學(xué)習(xí)技術(shù)和卷積神經(jīng)網(wǎng)絡(luò)(CNN),某些字體可以以字體識別率顯著提高的方式進(jìn)行訓(xùn)練。該方法也在工業(yè)設(shè)計和生產(chǎn)過程中發(fā)揮關(guān)鍵作用,特別是在工業(yè)4.0或工業(yè)物聯(lián)網(wǎng)的背景下。

  印刷字母或數(shù)字組合使得可以清楚和快速地識別組件并使其可用于自動化過程鏈。使用光學(xué)字符識別,諸如掃描儀和攝像機(jī)之類的圖像采集設(shè)備記錄數(shù)字圖像信息,并將其轉(zhuǎn)換成光柵圖形,將文本準(zhǔn)確地表示為后面一個像素。 OCR軟件讀出這些圖形,識別數(shù)字組合或字母,并將它們組合成單詞或甚至整個句子。機(jī)器視覺技術(shù)支持設(shè)計和生產(chǎn)過程中字符組合的光學(xué)識別。這些技術(shù)包括針對工業(yè)環(huán)境的特殊要求的特定功能。

  例如,經(jīng)過深思熟慮的分類技術(shù)即使在困難的條件下也能確保非常高的識別率。也可以毫無問題地識別模糊或傾斜的文字,即使是打印到或蝕刻到反射表面或高度紋理的彩色背景上的扭曲的字母或字符。

  深度學(xué)習(xí)技術(shù)的特點(diǎn)是分析大量的數(shù)字圖像數(shù)據(jù),從而訓(xùn)練必須識別的某些對象的模型。這對于物理對象以及字母或數(shù)字都有用。標(biāo)簽附加到標(biāo)識對象的數(shù)據(jù),例如“狗”或“字母A”。現(xiàn)在可以基于經(jīng)過訓(xùn)練的模型對新記錄的圖像信息的內(nèi)容進(jìn)行可靠的聲明。因此,每當(dāng)新圖像被“標(biāo)記”時,該技術(shù)就會得到學(xué)習(xí)。這增加了可靠地識別盡可能多的不同版本的圖像內(nèi)容的可能性,例如其他種類的狗或具有變化的字體或形狀的字符。