通過計(jì)算機(jī)視覺中的機(jī)器學(xué)習(xí)進(jìn)行對(duì)象檢測(cè)和分類,可以幫助照相機(jī)像人類一樣“看到”,識(shí)別出各種物理形狀,例如汽車,狗或人。
如何使用計(jì)算機(jī)視覺檢測(cè)人
數(shù)據(jù)科學(xué)家以及從智慧城市到零售再到監(jiān)視的廣泛行業(yè)中,對(duì)人類進(jìn)行實(shí)時(shí)檢測(cè)已成為一種重要趨勢(shì)。考慮似乎不再是科幻小說:
1、計(jì)數(shù)沿著小路或人行橫道的行人。
2、分析購物者的行為或停留時(shí)間。
3、家用安全攝像機(jī)可檢測(cè)訪客或入侵者。
實(shí)際上,這可能比您想象的要容易。
成功檢測(cè)圖像或視頻中的人物意味著您正在構(gòu)建將物體檢測(cè)和圖像分類結(jié)合起來的應(yīng)用程序??勺屇鷻z測(cè)圖像數(shù)據(jù)中對(duì)象的技術(shù)與當(dāng)前在許多行業(yè)中使用的流行視覺分類工具略有不同。
一方面,現(xiàn)在有了一個(gè)框架,可以以不同的準(zhǔn)確度檢測(cè)視頻中的特定對(duì)象。將識(shí)別出的對(duì)象在圖像中的位置與對(duì)對(duì)象類別的理解配對(duì)在一起,意味著您的應(yīng)用程序可以區(qū)分圖像一個(gè)區(qū)域中的人與可能被誤認(rèn)為人的對(duì)象(例如零售環(huán)境中的人體模型) 。
探索物體檢測(cè)意味著理解:
1、通過檢測(cè)圖像和視頻中的人物可以完成的工作
2、檢測(cè)人與人臉識(shí)別等其他技術(shù)有何不同
3、車輛檢測(cè)等一般物體檢測(cè)與人物檢測(cè)之間的關(guān)系
4、定義這些工具的概率問題
5、該技術(shù)的當(dāng)前和未來的現(xiàn)實(shí)世界工業(yè)4.0應(yīng)用
人體檢測(cè)的方式和方式
將對(duì)象檢測(cè)工具應(yīng)用于圖像和視頻可以完成什么工作?計(jì)算機(jī)視覺人員檢測(cè)可以完成三項(xiàng)不同的任務(wù):
1、從背景圖像中拾取對(duì)象
2、使用概率分?jǐn)?shù)將對(duì)象提議屬于某個(gè)類別(在這種情況下為人類)
3、使用xy起源以及身高和身長值定義擬議人員的邊界
示例:通過安全攝像機(jī)進(jìn)行物體檢測(cè)和人體形狀分類。
在較高的層次上,使用計(jì)算機(jī)視覺應(yīng)用程序?qū)D像進(jìn)行人體檢測(cè)時(shí)要考慮兩個(gè)因素。首先,存在技術(shù)方面的問題-如何識(shí)別圖像或視頻中的人物。第二部分是您可以如何處理結(jié)果,并且與從應(yīng)用程序中獲得的回報(bào)質(zhì)量有關(guān)。
對(duì)象檢測(cè)的工作原理
一般而言,解決如何檢測(cè)照片或視頻數(shù)據(jù)中的對(duì)象的問題始于圖像的系統(tǒng)劃分。首先,該工具將算法應(yīng)用于輸入以識(shí)別感興趣的區(qū)域。然后,機(jī)器將根據(jù)您的設(shè)置提出一系列對(duì)象建議。檢測(cè)的后步驟是根據(jù)模型對(duì)對(duì)象進(jìn)行分類,應(yīng)用概率閾值并返回接受的建議框架中的類別和位置。
在這種情況下,您要尋找的班級(jí)是人類。應(yīng)用程序通過使用深度學(xué)習(xí)人工智能系統(tǒng)對(duì)大量圖像進(jìn)行預(yù)訓(xùn)練的處理塊,在視野中檢測(cè)這些人為對(duì)象。這些處理模塊被稱為模型,可以對(duì)其進(jìn)行訓(xùn)練以識(shí)別人類可以看到的幾乎所有物體。
在計(jì)算機(jī)視覺應(yīng)用程序中實(shí)現(xiàn)人工檢測(cè)時(shí),您可以使用預(yù)先訓(xùn)練的模型或自己提供模型。您給模型提供的數(shù)據(jù)越多,設(shè)備在識(shí)別所需對(duì)象以及學(xué)習(xí)如何為將來進(jìn)行改進(jìn)方面就會(huì)越好。
如何使用物體檢測(cè)
獲得輸出后,將取決于您如何使用它。您的用例將確定各種細(xì)節(jié),例如檢測(cè)閾值。一種情況下較好的物體檢測(cè)工具可能不適用于其他情況。
由于模型訓(xùn)練和多層深度處理的進(jìn)步,機(jī)器在過去的幾年中已經(jīng)有效地執(zhí)行了這些任務(wù)。例如,特征提取和比較技術(shù)的兩個(gè)早期先鋒Deepeep和DeepID已經(jīng)變得如此高效,以至于現(xiàn)在存在許多面向消費(fèi)者的示例:例如,人們現(xiàn)在使用該技術(shù)來解鎖其平板電腦和手機(jī)。
云處理代表了CV的一項(xiàng)重要突破,將強(qiáng)大的資源交付給各地的開發(fā)人員。但是,新的CV平臺(tái)可輕松訪問開放的API平臺(tái),從而為開發(fā)人員提供了更大的靈活性?,F(xiàn)在,可以在邊緣的設(shè)備上構(gòu)建深度學(xué)習(xí)應(yīng)用程序。您無需成為計(jì)算機(jī)視覺專家,也無需依賴云連接來利用核心計(jì)算機(jī)視覺服務(wù)(例如對(duì)象檢測(cè))來處理和分析圖像。現(xiàn)在,各種規(guī)模的企業(yè)都可以在資源受限的低功耗設(shè)備上構(gòu)建和部署計(jì)算機(jī)視覺應(yīng)用程序。
在比您想象的更少的時(shí)間內(nèi)開始構(gòu)建對(duì)象檢測(cè)器。
人體檢測(cè)與物體檢測(cè)的應(yīng)用
檢測(cè)人和其他物體之間有區(qū)別。例如,制造中的對(duì)象檢測(cè)與大多數(shù)情況下的人員檢測(cè)有很大不同。
在工作場所,Rvsto Vision可以幫助工人安全或優(yōu)化人機(jī)交互。
制造對(duì)象檢測(cè)應(yīng)用程序可能涉及管道跟蹤或機(jī)器人行為分析,或使用計(jì)算機(jī)視覺分析微觀缺陷。同一行業(yè)中的人類檢測(cè)目標(biāo)可能更適合于操作的其他方面。例如,AI分析可能能夠利用現(xiàn)有的安全攝像機(jī)饋送來提高工廠工人的安全性,補(bǔ)充現(xiàn)有的做法和保障措施。AI CV工具能夠檢測(cè)對(duì)象類型(而不僅僅是對(duì)象的存在或移動(dòng))的能力實(shí)現(xiàn)了這種多功能性。
如何設(shè)定成功的機(jī)率
分類是物體檢測(cè)的核心概念之一。該模型接受圖像輸入,并根據(jù)其訓(xùn)練方式返回建議的對(duì)象類。例如,您可能構(gòu)建一個(gè)簡單的人體檢測(cè)應(yīng)用程序以瀏覽一系列圖像并尋找人。它將圖像與模型對(duì)人類是(不是)人類的理解進(jìn)行比較,然后為您輸入的每一個(gè)輸入返回概率值。這通常是一個(gè)從零到一百的百分比值,表示該程序?qū)φ掌腥祟惔嬖诘男判摹?/p>
幾乎每個(gè)對(duì)象檢測(cè)應(yīng)用程序都非常關(guān)注被檢測(cè)對(duì)象是提議類成員的可能性。通常,對(duì)象檢測(cè)算法定義的每個(gè)區(qū)域都會(huì)分配一個(gè)概率分?jǐn)?shù)。通過各種方法確保的這些分?jǐn)?shù)的平均值將返回建議對(duì)象為人的總概率。這些數(shù)字可能會(huì)由于多種因素而有所不同:
1、模型中的數(shù)據(jù)量和訓(xùn)練水平
2、對(duì)圖像執(zhí)行的分析類型
3、數(shù)據(jù)輸入的質(zhì)量
4、物體相對(duì)于總圖像的尺寸
例如,高精度,低速分析可能從大量的框開始,并應(yīng)用對(duì)它們進(jìn)行排序的規(guī)則,以尋找可能的結(jié)果。較低精度的快速分析可能會(huì)采用網(wǎng)格并分析模型中每個(gè)類的存在的每個(gè)部分。不管您打算采用哪種流程,您的應(yīng)用程序目標(biāo)都將決定您在輸出時(shí)所需的概率。
較重要的是要了解嵌入式設(shè)備的硬件或類型,以及用例目標(biāo)對(duì)于建立成功的開發(fā)周期很重要。了解您的選擇是找到理想實(shí)現(xiàn)的第一步。
了解面部檢測(cè)與面部識(shí)別
面部識(shí)別和面部檢測(cè)有一些相似之處,特別是在技術(shù)方面,但是在實(shí)用性方面有所不同。在查看對(duì)象檢測(cè)平臺(tái)或模型時(shí),請(qǐng)確保您知道其中的區(qū)別:
1、面部識(shí)別可以根據(jù)人的特征來識(shí)別他們,
2、面部檢測(cè)可發(fā)現(xiàn)個(gè)人面孔,無需個(gè)人識(shí)別
面部識(shí)別通過將其面部特征與已知圖像或一組圖像(例如護(hù)照控制站或用于安全訪問的身份檢查點(diǎn))相匹配來識(shí)別一個(gè)人。
面部檢測(cè)用于對(duì)物理空間中的人進(jìn)行計(jì)數(shù),還可以用于區(qū)分空間的進(jìn)入與退出,或看廣告或物體所花費(fèi)的時(shí)間/凝視時(shí)間。
面部識(shí)別和面部檢測(cè)都使用對(duì)象檢測(cè)框架來對(duì)視野中的對(duì)象進(jìn)行分類和定位。人臉檢測(cè)將獲取某種類型的圖像輸入,檢查對(duì)象的人物或面部類別并將其放置在框架中。此外,面部識(shí)別還將挑選出眼睛,嘴巴和其他各種特征,以與已知數(shù)據(jù)集進(jìn)行比較。
該過程的通用技術(shù)方面或多或少在相似之處結(jié)束。目標(biāo)通常大不相同。盡管人臉識(shí)別可以找到人臉并分析其特征,但是大多數(shù)人臉檢測(cè)工具需要確認(rèn)人的存在并確定其位置。
這給您選擇。例如,在一家商店中,具有面部檢測(cè)功能的解決方案可以計(jì)算出顧客的數(shù)量以及在商店各個(gè)部分所花費(fèi)的時(shí)間,而面部識(shí)別可以用于識(shí)別顧客數(shù)據(jù)集并將其排除在顧客數(shù)據(jù)集中。
如何選擇較佳的物體檢測(cè)方法
與每項(xiàng)新興技術(shù)一樣,在計(jì)算機(jī)視覺方面,有很多技術(shù)術(shù)語可能會(huì)引起混淆或被視為同義詞。有分類,檢測(cè),跟蹤,計(jì)數(shù)等等。但是,較大的困惑點(diǎn)之一是物體檢測(cè)和圖像分類。在較基本的層次上,分類和檢測(cè)之間的區(qū)別很簡單:
1、分類基于對(duì)內(nèi)容的分析將預(yù)測(cè)應(yīng)用于圖像。
2、檢測(cè)可定位圖像中的對(duì)象。
聯(lián)系我們,并使用我們的平臺(tái)輕松構(gòu)建對(duì)象檢測(cè)器應(yīng)用并將其部署到您的電路板上。
當(dāng)對(duì)象分類起作用時(shí)
分類是計(jì)算機(jī)視覺中的主要挑戰(zhàn),并且通常是對(duì)象檢測(cè)的先決條件。在這里,通常會(huì)利用大數(shù)據(jù)-需要大量信息來訓(xùn)練能夠識(shí)別各種對(duì)象的通用模型。定制模型通常還需要許多正面和負(fù)面的例子。還有其他因素也會(huì)起作用,例如圖像中的對(duì)象大小,圖片質(zhì)量等。
當(dāng)然,將對(duì)象放在特定類別中是檢測(cè)的有用元素。實(shí)際上,一旦您超過了識(shí)別對(duì)象存在的門檻,對(duì)它們進(jìn)行分類就成為許多應(yīng)用程序中的下一個(gè)主要步驟。
該過程本身也很有用。例如,它可以幫助自動(dòng)注釋數(shù)據(jù)庫項(xiàng)目。但是,由于嚴(yán)格分類只能提供描述存在一類物體的可能性的概率表或一組表,因此僅憑它就不能促進(jìn)檢測(cè),跟蹤,定位或其他類似任務(wù)。
較重要的是,對(duì)對(duì)象進(jìn)行分類是檢測(cè)圖像和視頻中人物的必要先決條件。畢竟,對(duì)于CV工具而言,人類是一類視覺對(duì)象。諸如YOLO之類的快速掃描工具可能是個(gè)例外,它們會(huì)針對(duì)對(duì)象的存在進(jìn)行預(yù)測(cè),而與對(duì)象的類無關(guān)。在這種類型的系統(tǒng)中的單類模型中,分類和檢測(cè)實(shí)際上將同時(shí)發(fā)生。在任何情況下,即使檢測(cè)對(duì)象的過程幾乎總是依賴于分類,但并非所有分類任務(wù)都須是對(duì)象檢測(cè)任務(wù)。
將檢測(cè)擴(kuò)展到對(duì)象跟蹤
跟蹤對(duì)象是對(duì)象檢測(cè)的有用的應(yīng)用程序。在檢測(cè)到某個(gè)人之后,您可能希望通過零售設(shè)置中的購物管道來跟蹤主題,或者例如跟蹤并整理多個(gè)不同檢測(cè)輸入流上的行為。
零售熱圖通過使用計(jì)算機(jī)視覺對(duì)象檢測(cè)和跟蹤從安全攝像機(jī)收集的數(shù)據(jù)來確定客戶的流量模式和在銷售地點(diǎn)花費(fèi)的時(shí)間。
假設(shè)您是一家零售商,并為特定產(chǎn)品設(shè)定了銷售目標(biāo)。您可以通過跟蹤互動(dòng)后的客戶行為來分析員工傳達(dá)促銷信息的有效性。如果在到達(dá)客戶時(shí)收到有關(guān)促銷的消息,那么該客戶會(huì)立即還是在以后的購物經(jīng)歷中購買商品?跨一系列商店攝像機(jī)的對(duì)象跟蹤可以幫助您了解溝通策略的有效性。
將檢測(cè)與對(duì)象計(jì)數(shù)一起使用
您可以優(yōu)化應(yīng)用程序以進(jìn)一步處理檢測(cè)到的對(duì)象的另一種方法是對(duì)它們進(jìn)行計(jì)數(shù)。如果您具有某些類型的變量,這將成為一個(gè)復(fù)雜的問題。例如,在決定如何分配安全資源時(shí),大批人群通過多個(gè)訪問點(diǎn)進(jìn)入和離開節(jié)日?qǐng)龅乜赡軜?gòu)成挑戰(zhàn)。通過使用具有嵌入式計(jì)數(shù)功能的固定式CV攝像機(jī)或無人機(jī),安全公司可以獲得準(zhǔn)確,更新的人口計(jì)數(shù)和密度數(shù)據(jù),以告知人員決策。
對(duì)象計(jì)數(shù)通常要求您對(duì)對(duì)象進(jìn)行分類。但是,除了交叉檢查所有位置值都不相同之外,您不必返回其位置。因此,對(duì)象計(jì)數(shù)更多地是檢測(cè)的子集。
構(gòu)建一個(gè)應(yīng)用來計(jì)數(shù)或跟蹤對(duì)象?開始輕松地部署到嵌入式設(shè)備。?
何時(shí)使用工具組合
當(dāng)然,將人工智能和智能視覺帶入嵌入式設(shè)備的實(shí)際用例不僅需要一種核心計(jì)算機(jī)視覺服務(wù),還需要更多的服務(wù)。您可能希望以各種功能一起使用的方式使用它們,并使您的應(yīng)用程序或設(shè)備更智能。但是,將各種計(jì)算機(jī)視覺功能組合到邊緣設(shè)備上的應(yīng)用程序時(shí),需要考慮許多因素。
從理論上講,這聽起來不錯(cuò),并且在實(shí)踐中也可以起作用。這是一個(gè)使用所有這三種計(jì)算機(jī)視覺技術(shù)的假設(shè)示例。
問題:您要在有人進(jìn)入商店時(shí)檢測(cè)他們,并確定他們?cè)谔囟ǖ攸c(diǎn)移動(dòng)時(shí)與特定燈具交互的可能性。
對(duì)象檢測(cè):您將編寫并訓(xùn)練一個(gè)人機(jī)交互模型來檢測(cè)您的設(shè)備和人,并使客戶與同事區(qū)分開。
對(duì)象跟蹤:您將實(shí)現(xiàn)跟蹤功能,以在檢測(cè)到商店中的客戶后跟蹤他們,并記錄他們與顯示器交互的詳細(xì)信息。
對(duì)象計(jì)數(shù):對(duì)象檢測(cè)可對(duì)指定類別中的單個(gè)對(duì)象進(jìn)行計(jì)數(shù),例如對(duì)人員進(jìn)行計(jì)數(shù)或?qū)μ囟óa(chǎn)品進(jìn)行計(jì)數(shù)。
結(jié)合計(jì)算機(jī)視覺原語,零售商可以通過計(jì)算在顯示器前停下的顧客數(shù)量,花費(fèi)在看產(chǎn)品或通訊上的時(shí)間以及看該產(chǎn)品是否是放入購物車并購買。
如何在嵌入式設(shè)備上實(shí)現(xiàn)計(jì)算機(jī)視覺
從無人駕駛汽車,交通監(jiān)控到智能城市和交通中心,物聯(lián)網(wǎng)嵌入式設(shè)備已被用作主要或輔助工具。對(duì)象檢測(cè)對(duì)于各個(gè)行業(yè)的應(yīng)用程序很有用:
1、零售
2、安全
3、農(nóng)業(yè)
4、衛(wèi)生保健
5、制造業(yè)
現(xiàn)在,對(duì)象檢測(cè)在準(zhǔn)確性和速度方面正在趕上人類,現(xiàn)在是將深度學(xué)習(xí)計(jì)算機(jī)視覺AI交付日常開發(fā)人員的時(shí)候了。工具在那里,處理負(fù)擔(dān)得起,其價(jià)值正等待添加到現(xiàn)有架構(gòu)中。
現(xiàn)有的家庭安全攝像機(jī)或日常網(wǎng)絡(luò)攝像機(jī)可以通過alwaysAI技術(shù)進(jìn)行升級(jí),以更準(zhǔn)確地通知所有者攝像機(jī)檢測(cè)到的運(yùn)動(dòng)源,從而消除了落葉引起的虛假信號(hào),同時(shí)區(qū)分了動(dòng)物和人。
您可能會(huì)對(duì)當(dāng)前的某些相機(jī)和設(shè)備可以在何種程度上集成人工智能感到驚訝,即使它們處于資源受限,低功耗的環(huán)境中,也沒有網(wǎng)絡(luò)連接或無法訪問云計(jì)算。
為您的企業(yè)部署計(jì)算機(jī)視覺應(yīng)用程序
想象一下具有CV功能的邊緣設(shè)備可以為您的企業(yè)做些什么。然后,獲取實(shí)現(xiàn)它所需的反饋和基礎(chǔ)。有了正確的開發(fā)環(huán)境和支持,您會(huì)發(fā)現(xiàn)這些應(yīng)用程序很容易實(shí)現(xiàn)。