机器人定位技术揭秘

定位技術(shù)是機(jī)器人實(shí)現(xiàn)自主定位導(dǎo)航的最基本環(huán)節(jié)，是機(jī)器人在二維工作環(huán)境中相對(duì)于全局坐標(biāo)的位置及其本身的姿態(tài)。目前SLAM （Simultaneous Localization and Mapping即時(shí)定位與地圖構(gòu)建）是業(yè)內(nèi)主流的定位技術(shù)，有激光SLAM和視覺SLAM之分。

什么是激光SLAM？

激光SLAM脫胎于早期的基于測距的定位方法(如超聲和紅外單點(diǎn)測距)。激光雷達(dá)(Light Detection And Ranging)的出現(xiàn)和普及使得測量更快更準(zhǔn)，信息更豐富。激光雷達(dá)采集到的物體信息呈現(xiàn)出一系列分散的、具有準(zhǔn)確角度和距離信息的點(diǎn)，被稱為點(diǎn)云。通常，激光SLAM系統(tǒng)通過對(duì)不同時(shí)刻兩片點(diǎn)云的匹配與比對(duì)，計(jì)算激光雷達(dá)相對(duì)運(yùn)動(dòng)的距離和姿態(tài)的改變，也就完成了對(duì)機(jī)器人自身的定位。

激光雷達(dá)距離測量比較準(zhǔn)確，誤差模型簡單，在強(qiáng)光直射以外的環(huán)境中運(yùn)行穩(wěn)定，點(diǎn)云的處理也比較容易。同時(shí)，點(diǎn)云信息本身包含直接的幾何關(guān)系，使得機(jī)器人的路徑規(guī)劃和導(dǎo)航變得直觀。激光SLAM理論研究也相對(duì)成熟，落地產(chǎn)品更豐富。

什么是視覺SLAM？

眼睛是人類獲取外界信息的主要來源，視覺SLAM也具有類似特點(diǎn)，它可以從環(huán)境中獲取海量的、富于冗余的紋理信息，擁有超強(qiáng)的場景辨識(shí)能力。早期的視覺SLAM基于濾波理論，其非線性的誤差模型和巨大的計(jì)算量成為了它實(shí)用落地的障礙。近年來，隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機(jī)技術(shù)、計(jì)算性能的進(jìn)步，實(shí)時(shí)運(yùn)行的視覺SLAM已經(jīng)不再是夢想。

通常，一個(gè)視覺SLAM系統(tǒng)由前端和后端組成。前端負(fù)責(zé)通過視覺增量式計(jì)算機(jī)器人的位姿，速度較快。后端，主要負(fù)責(zé)兩個(gè)功能：

一是在出現(xiàn)回環(huán)(即判定機(jī)器人回到了之前訪問過的地點(diǎn)附近)時(shí)，發(fā)現(xiàn)回環(huán)并修正兩次訪問中間各處的位置與姿態(tài)；

二是當(dāng)前端跟蹤丟失時(shí)，根據(jù)視覺的紋理信息對(duì)機(jī)器人進(jìn)行重新定位。簡單說，前端負(fù)責(zé)快速定位，后端負(fù)責(zé)較慢的地圖維護(hù)。

視覺SLAM的優(yōu)點(diǎn)是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌，基于點(diǎn)云的激光SLAM算法無法區(qū)別他們，而視覺則可以輕易分辨。這帶來了重定位、場景分類上無可比擬的巨大優(yōu)勢。同時(shí)，視覺信息可以較為容易的被用來跟蹤和預(yù)測場景中的動(dòng)態(tài)目標(biāo)，如行人、車輛等，對(duì)于在復(fù)雜動(dòng)態(tài)場景中的應(yīng)用這是至關(guān)重要的。第三，視覺的投影模型理論上可以讓無限遠(yuǎn)處的物體都進(jìn)入視覺畫面中，在合理的配置下(如長基線的雙目相機(jī))可以進(jìn)行很大尺度場景的定位與地圖構(gòu)建。

一直以來，業(yè)內(nèi)對(duì)激光SLAM與視覺SLAM到底誰更勝一籌，誰是未來主流趨勢都有自己的看法，以下將簡單從幾個(gè)方面進(jìn)行對(duì)比。

應(yīng)用場景

從應(yīng)用場景來說，視覺SLAM 的應(yīng)用場景要豐富很多。視覺SLAM 在室內(nèi)外環(huán)境下均能開展工作，但是對(duì)光的依賴程度高，在暗處或者一些無紋理區(qū)域是無法進(jìn)行工作的。而激光 SLAM 目前主要被應(yīng)用在室內(nèi)，用來進(jìn)行地圖構(gòu)建和導(dǎo)航工作。

定位和地圖構(gòu)建精度

在靜態(tài)且簡單的環(huán)境中，激光SLAM定位總體來講優(yōu)于視覺SLAM，但在較大尺度且動(dòng)態(tài)的環(huán)境中，視覺SLAM因?yàn)槠渚哂械募y理信息，表現(xiàn)出更好的效果。在地圖構(gòu)建上，激光 SLAM精度較高，國內(nèi)思嵐科技的 RPLIDAR 系列構(gòu)建的地圖精度可達(dá)到 2cm 左右。而視覺SLAM，比如大家常見的，也用的非常多的深度攝像機(jī) Kinect，（測距范圍在 3-12m 之間），地圖構(gòu)建精度約 3cm；所以激光 SLAM 構(gòu)建的地圖精度一般來說比視覺SLAM 高，且能直接用于定位導(dǎo)航。

易用性

激光 SLAM和基于深度相機(jī)的視覺SLAM 均是通過直接獲取環(huán)境中的點(diǎn)云數(shù)據(jù)，根據(jù)生成的點(diǎn)云數(shù)據(jù)，測算哪里有障礙物以及障礙物的距離。但是基于單目、雙目、魚眼攝像機(jī)的視覺SLAM 方案，則不能直接獲得環(huán)境中的點(diǎn)云，而是形成灰色或彩色圖像，需要通過不斷移動(dòng)自身的位置，通過提取、匹配特征點(diǎn)，利用三角測距的方法測算出障礙物的距離。

除了上面幾點(diǎn)之外，在探測范圍、運(yùn)算強(qiáng)度、實(shí)時(shí)數(shù)據(jù)生成、地圖累計(jì)誤差等方面，激光 SLAM 和視覺 SLAM 也會(huì)存在一定的差距。

機(jī)器人定位技術(shù)之SLAM

注：左為 Lidar SLAM，右為視覺SLAM，數(shù)據(jù)來源：KITTI

可以明顯看出，對(duì)于同一個(gè)場景，視覺SLAM 在后半程中出現(xiàn)了偏差，這是因?yàn)槔鄯e誤差所引起的，所以視覺SLAM 要進(jìn)行回環(huán)檢驗(yàn)。

機(jī)器人定位技術(shù)

總體來說，激光 SLAM 是目前比較成熟的機(jī)器人定位導(dǎo)航技術(shù)，而視覺 SLAM是未來研究的主流方向。未來，多傳感器的融合是一種必然的趨勢。取長補(bǔ)短，優(yōu)勢結(jié)合，為市場打造出真正好用的、易用的 SLAM 方案。

關(guān)鍵字：机器人定位技术,机器人主流定位技术

机器人定位技术揭秘

相关阅读

购买渠道

关于我们

联系我们

关注我们