![Krediet: MIT Computer Science & Artificial Intelligence Lab Efficiëntere lidar-detectie voor zelfrijdende auto's](https://scx1.b-cdn.net/csz/news/800a/2021/more-efficient-lidar-s.jpg)
Krediet: MIT Computer Science & Artificial Intelligence Lab
Als je een zelfrijdende auto in het wild ziet, zie je misschien een gigantische draaiende cilinder bovenop het dak. Dat is een lidarsensor, die werkt door pulsen van infrarood licht uit te zenden en de tijd te meten die ze nodig hebben om van objecten te weerkaatsen. Zo ontstaat een kaart met 3D-punten die dienen als momentopname van de omgeving van de auto.
Een nadeel van lidar is dat de 3D-gegevens enorm en rekenintensief zijn. Een typische 64-kanaals sensor produceert bijvoorbeeld meer dan 2 miljoen punten per seconde. Vanwege de extra ruimtelijke dimensie vereisen de ultramoderne 3D-modellen 14x meer berekening op het tijdstip van inferentie in vergelijking met de 2D-beeld-tegenhanger. Dit betekent dat ingenieurs de gegevens doorgaans eerst in 2D moeten samenvouwen om effectief te kunnen navigeren. Het neveneffect hiervan is dat er aanzienlijk informatieverlies optreedt.
Maar een team van MIT heeft gewerkt aan een zelfsturend systeem dat gebruikmaakt van machine learning, zodat handmatig afstemmen niet nodig is. Hun nieuwe end-to-end-framework kan autonoom navigeren met alleen onbewerkte 3D-puntenwolkgegevens en gps-kaarten met een lage resolutie, vergelijkbaar met de kaarten die tegenwoordig beschikbaar zijn op smartphones.
End-to-end leren van onbewerkte lidar-gegevens is een rekenintensief proces, omdat het inhoudt dat de computer enorme hoeveelheden rijke sensorische informatie krijgt om te leren sturen. Daarom moest het team nieuwe deep learning-componenten ontwerpen die efficiënter gebruik maakten van moderne GPU-hardware om het voertuig in realtime te besturen.
“We hebben onze oplossing geoptimaliseerd vanuit zowel algoritme- als systeemperspectieven, waardoor een cumulatieve versnelling van ongeveer 9x is bereikt in vergelijking met bestaande 3D-lidarbenaderingen”, zegt Ph.D. student Zhijian Liu, die samen met Alexander Amini de co-hoofdauteur van dit artikel was.
In tests toonden de onderzoekers aan dat hun systeem verminderde hoe vaak een menselijke bestuurder de controle over de machine moest overnemen en zelfs bestand was tegen ernstige sensorstoringen.
Stel je bijvoorbeeld voor dat je door een tunnel rijdt en dan uitkomt in het zonlicht – voor een fractie van een seconde zullen je ogen waarschijnlijk moeite hebben met zien vanwege de schittering. Een soortgelijk probleem doet zich voor bij de camera’s in zelfrijdende auto’s, maar ook bij de lidarsensoren van de systemen bij slechte weersomstandigheden.
Om hiermee om te gaan, kan het systeem van het MIT-team inschatten hoe zeker het is over een bepaalde voorspelling, en kan het daarom meer of minder gewicht toekennen aan die voorspelling bij het nemen van zijn beslissingen. (In het geval dat het uit een tunnel komt, zou het in wezen elke voorspelling negeren die niet vertrouwd zou moeten worden vanwege onnauwkeurige sensorgegevens.)
Het team noemt hun benadering “hybride bewijskrachtfusie”, omdat het de verschillende controlevoorspellingen samenvoegt om tot zijn bewegingsplanningskeuzes te komen.
“Door de controlevoorspellingen samen te voegen met de onzekerheid van het model, kan het systeem zich aanpassen aan onverwachte gebeurtenissen”, zegt MIT-professor Daniela Rus, een van de senior auteurs van de paper.
In veel opzichten is het systeem zelf een fusie van drie eerdere MIT-projecten:
- MapLite, een met de hand afgesteld raamwerk voor autorijden zonder high-definition 3D-kaarten
- “variabele end-to-end-navigatie”, een machine learning-systeem dat is getraind met behulp van menselijke rijgegevens om vanaf nul te leren navigeren
- SPVNAS, een efficiënte 3D deep learning-oplossing die neurale architectuur en inferentiebibliotheek optimaliseert
“We hebben de voordelen van een mapless-aanpak benut en deze gecombineerd met end-to-end machine learning, zodat we geen deskundige programmeurs nodig hebben om het systeem met de hand af te stemmen”, zegt Amini.
Als volgende stap is het team van plan om hun systeem te blijven opschalen naar toenemende complexiteit in de echte wereld, inclusief ongunstige weersomstandigheden en dynamische interactie met andere voertuigen.
Efficiënte en robuuste, op LiDAR gebaseerde end-to-end-navigatie, arXiv: 2105.09932v1 [cs.RO] arxiv.org/abs/2105.09932
Geleverd door Massachusetts Institute of Technology