計算機視覺、機器視覺感知與SLAM比較

  目前,基于深度學(xué)習(xí)的計算機視覺,發(fā)展了相關(guān)算法,在人臉識別、無人駕駛等方面有了一定的進展與實際應(yīng)用,SLAM技術(shù)對可移動的智能硬件,在定位與建圖層次也有了一定的支撐,那么有沒有更自然更普適的視覺模型與視覺算法。

  生物及人類的視覺原理是什么,至今在科技界也無確切的研究清楚,一個三維物體,人眼從不同的角度看過后,得到真實三維物體的一個“開覆蓋”,這個“開覆蓋”在人類大腦里就有了這個物體所對應(yīng)的一個視覺感知,這個感知在大腦里的存儲是二維的還是多維的?存儲的信息是曲率還是輪廓線?這里的對應(yīng)是共形映射還是普通雙射或是其他?等等類似這些問題,至今我們一概沒有頭緒,但這并不妨礙我們持續(xù)地去觀察及研究。

  目前,基于深度學(xué)習(xí)的計算機視覺,發(fā)展了相關(guān)算法,在人臉識別、無人駕駛等方面有了一定的進展與實際應(yīng)用,SLAM技術(shù)對可移動的智能硬件,在定位與建圖層次也有了一定的支撐,那么有沒有更自然更普適的視覺模型與視覺算法。

  以上分析中,提到了“開覆蓋”、“共形映射”,那么視覺的理論基礎(chǔ)會不會是微分幾何,視覺感知物體與環(huán)境,會不會是在分析曲率的一種概率分布,本文就以此為出發(fā)點,逐步剝開一種更具普適性的視覺感知模型——機器視覺感知。

  本文來源于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除,謝謝!