SLAM是Simultaneous localization and mapping縮寫,意為“同步定位與建圖”,主要用于解決機(jī)器人在未知環(huán)境運(yùn)動(dòng)時(shí)的定位與地圖構(gòu)建問(wèn)題,為了讓大家更多的了解SLAM,以下將從SLAM的應(yīng)用領(lǐng)域、SLAM框架、SLAM分類(基于傳感器的SLAM分類)來(lái)進(jìn)行全面闡述,本文僅對(duì)沒有接觸過(guò)SLAM的新人進(jìn)行的科普。
一、SLAM的典型應(yīng)用領(lǐng)域
機(jī)器人定位導(dǎo)航領(lǐng)域:地圖建模。SLAM可以輔助機(jī)器人執(zhí)行路徑規(guī)劃、自主探索、導(dǎo)航等任務(wù)。國(guó)內(nèi)的科沃斯、塔米以及最新面世的嵐豹掃地機(jī)器人都可以通過(guò)用SLAM算法結(jié)合激光雷達(dá)或者攝像頭的方法,讓掃地機(jī)高效繪制室內(nèi)地圖,智能分析和規(guī)劃掃地環(huán)境,從而成功讓自己步入了智能導(dǎo)航的陣列。國(guó)內(nèi)思嵐科技(SLAMTEC)為這方面技術(shù)的主要提供商,SLAMTEC的命名就是取自SLAM的諧音,其主要業(yè)務(wù)就是研究服務(wù)機(jī)器人自主定位導(dǎo)航的解決方案。目前思嵐科技已經(jīng)讓關(guān)鍵的二維激光雷達(dá)部件售價(jià)降至百元,這在一定程度上無(wú)疑進(jìn)一步拓展了SLAM技術(shù)的應(yīng)用前景。
VR/AR方面:輔助增強(qiáng)視覺效果。SLAM技術(shù)能夠構(gòu)建視覺效果更為真實(shí)的地圖,從而針對(duì)當(dāng)前視角渲染虛擬物體的疊加效果,使之更真實(shí)沒有違和感。VR/AR代表性產(chǎn)品中微軟Hololens、谷歌ProjectTango以及MagicLeap都應(yīng)用了SLAM作為視覺增強(qiáng)手段。
無(wú)人機(jī)領(lǐng)域:地圖建模。SLAM可以快速構(gòu)建局部3D地圖,并與地理信息系統(tǒng)(GIS)、視覺對(duì)象識(shí)別技術(shù)相結(jié)合,可以輔助無(wú)人機(jī)識(shí)別路障并自動(dòng)避障規(guī)劃路徑,曾經(jīng)刷爆美國(guó)朋友圈的Hovercamera無(wú)人機(jī),就應(yīng)用到了SLAM技術(shù)。
無(wú)人駕駛領(lǐng)域:視覺里程計(jì)。SLAM技術(shù)可以提供視覺里程計(jì)功能,并與GPS等其他定位方式相融合,從而滿足無(wú)人駕駛精準(zhǔn)定位的需求。例如,應(yīng)用了基于激光雷達(dá)技術(shù)Google無(wú)人駕駛車以及牛津大學(xué)MobileRoboticsGroup11年改裝的無(wú)人駕駛汽車野貓(Wildcat)均已成功路測(cè)。
二、SLAM框架
SLAM系統(tǒng)框架如圖所示,一般分為五個(gè)模塊,包括傳感器數(shù)據(jù)、視覺里程計(jì)、后端、建圖及回環(huán)檢測(cè)。
傳感器數(shù)據(jù):主要用于采集實(shí)際環(huán)境中的各類型原始數(shù)據(jù)。包括激光掃描數(shù)據(jù)、視頻圖像數(shù)據(jù)、點(diǎn)云數(shù)據(jù)等。
視覺里程計(jì):主要用于不同時(shí)刻間移動(dòng)目標(biāo)相對(duì)位置的估算。包括特征匹配、直接配準(zhǔn)等算法的應(yīng)用。
后端:主要用于優(yōu)化視覺里程計(jì)帶來(lái)的累計(jì)誤差。包括濾波器、圖優(yōu)化等算法應(yīng)用。
建圖:用于三維地圖構(gòu)建。
回環(huán)檢測(cè):主要用于空間累積誤差消除
其工作流程大致為:
傳感器讀取數(shù)據(jù)后,視覺里程計(jì)估計(jì)兩個(gè)時(shí)刻的相對(duì)運(yùn)動(dòng)(Ego-motion),后端處理視覺里程計(jì)估計(jì)結(jié)果的累積誤差,建圖則根據(jù)前端與后端得到的運(yùn)動(dòng)軌跡來(lái)建立地圖,回環(huán)檢測(cè)考慮了同一場(chǎng)景不同時(shí)刻的圖像,提供了空間上約束來(lái)消除累積誤差。
三、SLAM分類(基于傳感器的SLAM分類)
目前用在SLAM上的傳感器主要分為這兩類,一種是基于激光雷達(dá)的激光SLAM(Lidar SLAM)和基于視覺的VSLAM(Visual SLAM)。
1.激光SLAM
激光SLAM采用2D或3D激光雷達(dá)(也叫單線或多線激光雷達(dá)),2D激光雷達(dá)一般用于室內(nèi)機(jī)器人上(如掃地機(jī)器人),而3D激光雷達(dá)一般使用于無(wú)人駕駛領(lǐng)域。激光雷達(dá)的出現(xiàn)和普及使得測(cè)量更快更準(zhǔn),信息更豐富。激光雷達(dá)采集到的物體信息呈現(xiàn)出一系列分散的、具有準(zhǔn)確角度和距離信息的點(diǎn),被稱為點(diǎn)云。通常,激光SLAM系統(tǒng)通過(guò)對(duì)不同時(shí)刻兩片點(diǎn)云的匹配與比對(duì),計(jì)算激光雷達(dá)相對(duì)運(yùn)動(dòng)的距離和姿態(tài)的改變,也就完成了對(duì)機(jī)器人自身的定位。
激光雷達(dá)測(cè)距比較準(zhǔn)確,誤差模型簡(jiǎn)單,在強(qiáng)光直射以外的環(huán)境中運(yùn)行穩(wěn)定,點(diǎn)云的處理也比較容易。同時(shí),點(diǎn)云信息本身包含直接的幾何關(guān)系,使得機(jī)器人的路徑規(guī)劃和導(dǎo)航變得直觀。激光SLAM理論研究也相對(duì)成熟,落地產(chǎn)品更豐富。
2.視覺SLAM
眼睛是人類獲取外界信息的主要來(lái)源。視覺SLAM也具有類似特點(diǎn),它可以從環(huán)境中獲取海量的、富于冗余的紋理信息,擁有超強(qiáng)的場(chǎng)景辨識(shí)能力。早期的視覺SLAM基于濾波理論,其非線性的誤差模型和巨大的計(jì)算量成為了它實(shí)用落地的障礙。近年來(lái),隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機(jī)技術(shù)、計(jì)算性能的進(jìn)步,實(shí)時(shí)運(yùn)行的視覺SLAM已經(jīng)不再是夢(mèng)想。
視覺SLAM的優(yōu)點(diǎn)是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌,基于點(diǎn)云的激光SLAM算法無(wú)法區(qū)別他們,而視覺則可以輕易分辨。這帶來(lái)了重定位、場(chǎng)景分類上無(wú)可比擬的巨大優(yōu)勢(shì)。同時(shí),視覺信息可以較為容易的被用來(lái)跟蹤和預(yù)測(cè)場(chǎng)景中的動(dòng)態(tài)目標(biāo),如行人、車輛等,對(duì)于在復(fù)雜動(dòng)態(tài)場(chǎng)景中的應(yīng)用這是至關(guān)重要的。
通過(guò)對(duì)比我們發(fā)現(xiàn),激光SLAM和視覺SLAM各擅勝場(chǎng),單獨(dú)使用都有其局限性,而融合使用則可能具有巨大的取長(zhǎng)補(bǔ)短的潛力。例如,視覺在紋理豐富的動(dòng)態(tài)環(huán)境中穩(wěn)定工作,并能為激光SLAM提供非常準(zhǔn)確的點(diǎn)云匹配,而激光雷達(dá)提供的精確方向和距離信息在正確匹配的點(diǎn)云上會(huì)發(fā)揮更大的威力。而在光照嚴(yán)重不足或紋理缺失的環(huán)境中,激光SLAM的定位工作使得視覺可以借助不多的信息進(jìn)行場(chǎng)景記錄。
近年來(lái),SLAM導(dǎo)航技術(shù)已取得了很大的發(fā)展,它將賦予機(jī)器人和其他智能體前所未有的行動(dòng)能力,而激光SLAM與視覺SLAM必將在相互競(jìng)爭(zhēng)和融合中發(fā)展,使機(jī)器人從實(shí)驗(yàn)室和展廳中走出來(lái),做到真正的服務(wù)于人類。
關(guān)鍵字:激光雷达,SLAM