對(duì)于人類而言,不僅可以通過眼睛“看清”周圍環(huán)境中的東西,還能“識(shí)別并理解”這些東西,對(duì)這些東西形成“認(rèn)知和決策”。
現(xiàn)在,盈泰德科技科技的技術(shù)人員正努力讓AI同樣做到這一點(diǎn)。從人類的三維視覺出發(fā),三維視覺智能已成為人工智能研究和應(yīng)用的熱門領(lǐng)域。
說到機(jī)器視覺,大家都不陌生,人工智能的很多技術(shù)是基于人的各種感觀的,其中視覺感觀就是非常重要的一環(huán),在機(jī)器視覺方面的很多技術(shù)已經(jīng)在工業(yè)界得到非常好的應(yīng)用。
隨著應(yīng)用的深入,越來越多的機(jī)器視覺技術(shù)進(jìn)入“三維視覺智能”階段,我們的眼睛不僅要看清某個(gè)東西,認(rèn)識(shí)某個(gè)東西,還要走到這個(gè)場(chǎng)景里面去,在三維世界里真實(shí)地感受場(chǎng)景,如同身臨其境。這就需要具有三維空間感知與認(rèn)知能力的智能,即三維視覺智能。三維視覺智能集合計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺等領(lǐng)域的技術(shù)與傳統(tǒng)的人工智能、學(xué)習(xí)、大數(shù)據(jù)等很好地交叉融合。
機(jī)器人安裝LMI(一種利用結(jié)構(gòu)光獲取三維模型信息的主動(dòng)式傳感器)掃描螺絲,能獲取目標(biāo)物體全方位的三維數(shù)據(jù)。機(jī)器人自己規(guī)劃掃描路徑,直到最后獲得一個(gè)完整的三維模型。
不僅要獲得場(chǎng)景的完整三維數(shù)據(jù),而且還要認(rèn)識(shí)每個(gè)物體到底是什么,要去理解場(chǎng)景里的每個(gè)物體,獲取物體的語義信息。同樣的道理,認(rèn)知的過程必須形成一個(gè)閉環(huán),機(jī)器人的實(shí)時(shí)決策能不能根據(jù)現(xiàn)有的三維數(shù)據(jù)對(duì)這個(gè)物體進(jìn)行識(shí)別。如果不可以,就要走到新的角度去獲取數(shù)據(jù)。
通過三維視覺與人工智能技術(shù)的結(jié)合,我們讓機(jī)器人更加智能化與功能化,讓機(jī)器人做更多人在現(xiàn)實(shí)生活中能夠做的事。機(jī)器人具備現(xiàn)場(chǎng)自主決策和執(zhí)行的能力,比如在工業(yè)流水線上可以幫助組裝配件,物流場(chǎng)景中搬箱子等。這樣的應(yīng)用,涉及到非常精細(xì)化的技術(shù),比如準(zhǔn)確高效的運(yùn)動(dòng)規(guī)劃,還有各種各樣的控制,智能的執(zhí)行等。