視覺目標定位(位姿測量)
從工程意義上來說,測量一個物體相對于另一個物體的位置與姿態(tài),即所謂的位姿測量。從數(shù)學意義上來講,測量兩個坐標系間的平移與旋轉(zhuǎn)變換關系,包括3個位置(Translational)和3個旋轉(zhuǎn)角(Rotational)共6個位姿量(即6DOF)。理論上,只要已知空間不共線的3點在兩個坐標系下的坐標,就能確定兩坐標系間的位姿關系,因此,位姿測量的關鍵就是如何得到特征點在這兩個坐標系下的坐標。
視覺空間定位的常見類型
自定位(inside-out),即通過相機拍攝視野坐標系,以及坐標系的特征點,從而判斷相機相對坐標系自身的坐標。比如我們常用的SLAM,這方面雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))之前也有嘉賓做過介紹,它的特點是便攜、視角理論無限大、定位精度不高。主要應用領域包括移動機器人、無人機、VR、AR。
外定位(outside-in),比較常見的是OptiTrack,特點是安裝復雜、視角有限、定位精度高。主要應用領域包括影視動捕、VR、工業(yè)機器人。
常見的不同硬件定位方案
單目定位(mono camera)
特點:系統(tǒng)簡單,運算量小,需要目標點之間有幾何約束關系,應用場景有限制,成本較低。
雙目定位(stereo camera)
特點:系統(tǒng)復雜,運算量大,可以單幀單目標點定位,對目標物體無幾何約束,,應用場合靈活,成本較高。
多目定位(multiple camera)
特點:系統(tǒng)非常復雜,運算量特別巨大,對目標物體無幾何約束要求,應用場合受限,成本很高。
目前關于雙目定位的研究與市場應用相對比較多,而單目定位則相對比較少,所以,接下來就重點講下單目定位。
(來源:CSDN)