SLAM究竟是什么？让你从0到1了解SLAM

SLAM是Simultaneous localization and mapping縮寫，意為“同步定位與建圖”，主要用于解決機(jī)器人在未知環(huán)境運(yùn)動(dòng)時(shí)的定位與地圖構(gòu)建問(wèn)題，為了讓大家更多的了解SLAM，以下將從SLAM的應(yīng)用領(lǐng)域、SLAM框架、SLAM分類（基于傳感器的SLAM分類）來(lái)進(jìn)行全面闡述，本文僅對(duì)沒有接觸過(guò)SLAM的新人進(jìn)行的科普。

一、SLAM的典型應(yīng)用領(lǐng)域

機(jī)器人定位導(dǎo)航領(lǐng)域：地圖建模。SLAM可以輔助機(jī)器人執(zhí)行路徑規(guī)劃、自主探索、導(dǎo)航等任務(wù)。國(guó)內(nèi)的科沃斯、塔米以及最新面世的嵐豹掃地機(jī)器人都可以通過(guò)用SLAM算法結(jié)合激光雷達(dá)或者攝像頭的方法，讓掃地機(jī)高效繪制室內(nèi)地圖，智能分析和規(guī)劃掃地環(huán)境，從而成功讓自己步入了智能導(dǎo)航的陣列。國(guó)內(nèi)思嵐科技(SLAMTEC)為這方面技術(shù)的主要提供商，SLAMTEC的命名就是取自SLAM的諧音，其主要業(yè)務(wù)就是研究服務(wù)機(jī)器人自主定位導(dǎo)航的解決方案。目前思嵐科技已經(jīng)讓關(guān)鍵的二維激光雷達(dá)部件售價(jià)降至百元，這在一定程度上無(wú)疑進(jìn)一步拓展了SLAM技術(shù)的應(yīng)用前景。

VR/AR方面：輔助增強(qiáng)視覺效果。SLAM技術(shù)能夠構(gòu)建視覺效果更為真實(shí)的地圖，從而針對(duì)當(dāng)前視角渲染虛擬物體的疊加效果，使之更真實(shí)沒有違和感。VR/AR代表性產(chǎn)品中微軟Hololens、谷歌ProjectTango以及MagicLeap都應(yīng)用了SLAM作為視覺增強(qiáng)手段。

無(wú)人機(jī)領(lǐng)域：地圖建模。SLAM可以快速構(gòu)建局部3D地圖，并與地理信息系統(tǒng)（GIS）、視覺對(duì)象識(shí)別技術(shù)相結(jié)合，可以輔助無(wú)人機(jī)識(shí)別路障并自動(dòng)避障規(guī)劃路徑，曾經(jīng)刷爆美國(guó)朋友圈的Hovercamera無(wú)人機(jī)，就應(yīng)用到了SLAM技術(shù)。

無(wú)人駕駛領(lǐng)域：視覺里程計(jì)。SLAM技術(shù)可以提供視覺里程計(jì)功能，并與GPS等其他定位方式相融合，從而滿足無(wú)人駕駛精準(zhǔn)定位的需求。例如，應(yīng)用了基于激光雷達(dá)技術(shù)Google無(wú)人駕駛車以及牛津大學(xué)MobileRoboticsGroup11年改裝的無(wú)人駕駛汽車野貓(Wildcat)均已成功路測(cè)。

二、SLAM框架

SLAM系統(tǒng)框架如圖所示，一般分為五個(gè)模塊，包括傳感器數(shù)據(jù)、視覺里程計(jì)、后端、建圖及回環(huán)檢測(cè)。

傳感器數(shù)據(jù)：主要用于采集實(shí)際環(huán)境中的各類型原始數(shù)據(jù)。包括激光掃描數(shù)據(jù)、視頻圖像數(shù)據(jù)、點(diǎn)云數(shù)據(jù)等。

視覺里程計(jì)：主要用于不同時(shí)刻間移動(dòng)目標(biāo)相對(duì)位置的估算。包括特征匹配、直接配準(zhǔn)等算法的應(yīng)用。

后端：主要用于優(yōu)化視覺里程計(jì)帶來(lái)的累計(jì)誤差。包括濾波器、圖優(yōu)化等算法應(yīng)用。

建圖：用于三維地圖構(gòu)建。

回環(huán)檢測(cè)：主要用于空間累積誤差消除

其工作流程大致為：

傳感器讀取數(shù)據(jù)后，視覺里程計(jì)估計(jì)兩個(gè)時(shí)刻的相對(duì)運(yùn)動(dòng)（Ego-motion），后端處理視覺里程計(jì)估計(jì)結(jié)果的累積誤差，建圖則根據(jù)前端與后端得到的運(yùn)動(dòng)軌跡來(lái)建立地圖，回環(huán)檢測(cè)考慮了同一場(chǎng)景不同時(shí)刻的圖像，提供了空間上約束來(lái)消除累積誤差。

三、SLAM分類（基于傳感器的SLAM分類）

目前用在SLAM上的傳感器主要分為這兩類，一種是基于激光雷達(dá)的激光SLAM(Lidar SLAM)和基于視覺的VSLAM(Visual SLAM)。

1.激光SLAM

激光SLAM采用2D或3D激光雷達(dá)（也叫單線或多線激光雷達(dá)），2D激光雷達(dá)一般用于室內(nèi)機(jī)器人上（如掃地機(jī)器人），而3D激光雷達(dá)一般使用于無(wú)人駕駛領(lǐng)域。激光雷達(dá)的出現(xiàn)和普及使得測(cè)量更快更準(zhǔn)，信息更豐富。激光雷達(dá)采集到的物體信息呈現(xiàn)出一系列分散的、具有準(zhǔn)確角度和距離信息的點(diǎn)，被稱為點(diǎn)云。通常，激光SLAM系統(tǒng)通過(guò)對(duì)不同時(shí)刻兩片點(diǎn)云的匹配與比對(duì)，計(jì)算激光雷達(dá)相對(duì)運(yùn)動(dòng)的距離和姿態(tài)的改變，也就完成了對(duì)機(jī)器人自身的定位。

激光雷達(dá)測(cè)距比較準(zhǔn)確，誤差模型簡(jiǎn)單，在強(qiáng)光直射以外的環(huán)境中運(yùn)行穩(wěn)定，點(diǎn)云的處理也比較容易。同時(shí)，點(diǎn)云信息本身包含直接的幾何關(guān)系，使得機(jī)器人的路徑規(guī)劃和導(dǎo)航變得直觀。激光SLAM理論研究也相對(duì)成熟，落地產(chǎn)品更豐富。

2.視覺SLAM

眼睛是人類獲取外界信息的主要來(lái)源。視覺SLAM也具有類似特點(diǎn)，它可以從環(huán)境中獲取海量的、富于冗余的紋理信息，擁有超強(qiáng)的場(chǎng)景辨識(shí)能力。早期的視覺SLAM基于濾波理論，其非線性的誤差模型和巨大的計(jì)算量成為了它實(shí)用落地的障礙。近年來(lái)，隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機(jī)技術(shù)、計(jì)算性能的進(jìn)步，實(shí)時(shí)運(yùn)行的視覺SLAM已經(jīng)不再是夢(mèng)想。

視覺SLAM的優(yōu)點(diǎn)是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌，基于點(diǎn)云的激光SLAM算法無(wú)法區(qū)別他們，而視覺則可以輕易分辨。這帶來(lái)了重定位、場(chǎng)景分類上無(wú)可比擬的巨大優(yōu)勢(shì)。同時(shí)，視覺信息可以較為容易的被用來(lái)跟蹤和預(yù)測(cè)場(chǎng)景中的動(dòng)態(tài)目標(biāo)，如行人、車輛等，對(duì)于在復(fù)雜動(dòng)態(tài)場(chǎng)景中的應(yīng)用這是至關(guān)重要的。

通過(guò)對(duì)比我們發(fā)現(xiàn)，激光SLAM和視覺SLAM各擅勝場(chǎng)，單獨(dú)使用都有其局限性，而融合使用則可能具有巨大的取長(zhǎng)補(bǔ)短的潛力。例如，視覺在紋理豐富的動(dòng)態(tài)環(huán)境中穩(wěn)定工作，并能為激光SLAM提供非常準(zhǔn)確的點(diǎn)云匹配，而激光雷達(dá)提供的精確方向和距離信息在正確匹配的點(diǎn)云上會(huì)發(fā)揮更大的威力。而在光照嚴(yán)重不足或紋理缺失的環(huán)境中，激光SLAM的定位工作使得視覺可以借助不多的信息進(jìn)行場(chǎng)景記錄。

近年來(lái)，SLAM導(dǎo)航技術(shù)已取得了很大的發(fā)展，它將賦予機(jī)器人和其他智能體前所未有的行動(dòng)能力，而激光SLAM與視覺SLAM必將在相互競(jìng)爭(zhēng)和融合中發(fā)展，使機(jī)器人從實(shí)驗(yàn)室和展廳中走出來(lái)，做到真正的服務(wù)于人類。

關(guān)鍵字：激光雷达,SLAM

SLAM究竟是什么？让你从0到1了解SLAM

相关阅读

购买渠道

关于我们

联系我们

关注我们