I sistemi di guida senza pilota sono davvero difficili da comprendere. Questo articolo ti dà la risposta

I sistemi di guida senza pilota sono davvero difficili da comprendere. Questo articolo ti dà la risposta

Oggigiorno, la tecnologia di guida senza pilota viene solitamente suddivisa in tre parti: percezione e posizionamento ambientale, pianificazione delle decisioni e controllo del movimento.

La percezione ambientale e il posizionamento sono responsabili della determinazione della presenza di auto o pedoni intorno all'auto, se il semaforo è rosso o verde, ovvero della determinazione dello stato dell'ambiente e dell'auto.

La pianificazione delle decisioni è responsabile di ciò che l'auto deve fare, se seguire o aggirare, accelerare o rallentare e quale percorso intraprendere che sia sicuro, efficiente e relativamente comodo.

Il controllo del movimento richiede la trasformazione elettronica degli attuatori dei veicoli tradizionali. Dopo che le istruzioni di decisione e la traiettoria sono state trasmesse al controllore, gli attuatori come motori, sterzo e freni devono mantenere la traiettoria pianificata il più rapidamente possibile e con il minor numero di deviazioni, proprio come un corpo forte può completare le istruzioni del cervello.

La percezione ambientale è l'"occhio" della guida autonoma

Nelle auto senza conducente, i sensori formano un modulo di percezione che sostituisce gli organi sensoriali del conducente. Ottengono in modo rapido e preciso informazioni sullo stato ambientale, tra cui la distanza dagli ostacoli, l'indicazione dei semafori più avanti, i numeri sui segnali dei limiti di velocità, nonché la posizione del veicolo, la velocità e altre condizioni del mezzo, il che costituisce una garanzia per una guida sicura. I sensori comunemente utilizzati per rilevare le condizioni ambientali includono telecamere, lidar, radar a onde millimetriche, sensori a ultrasuoni, ecc. I sensori per determinare lo stato del veicolo includono GPS/navigazione inerziale, sensori di velocità delle ruote, ecc.

Le auto a guida autonoma richiedono più sensori per funzionare insieme

La telecamera può classificare gli ostacoli in base alle caratteristiche dell'oggetto. Se si vogliono ottenere informazioni sulla profondità dell'ostacolo, sono necessarie due telecamere, ovvero quella che generalmente viene chiamata visione stereo binoculare. Le due telecamere della telecamera binoculare mantengono una certa distanza, proprio come la parallasse binoculare degli esseri umani, e lo scostamento tra i pixel viene calcolato attraverso il principio di triangolazione per ottenere le informazioni tridimensionali dell'oggetto. Oltre ad aiutare l'auto a determinare la propria posizione e velocità, la funzione principale della telecamera binoculare è quella di identificare i semafori e la segnaletica stradale per garantire che la guida autonoma rispetti le norme del codice stradale. Tuttavia, le telecamere binoculari sono notevolmente influenzate dai cambiamenti delle condizioni meteorologiche e di illuminazione e anche la quantità di calcoli da eseguire è piuttosto elevata, il che richiede all'unità di elaborazione requisiti di prestazioni molto elevati.

I radar comunemente utilizzati nei veicoli senza pilota sono il lidar e il radar a onde millimetriche. Il Lidar rileva principalmente la posizione, la velocità e altre grandezze caratteristiche del bersaglio emettendo raggi laser. La tecnologia LiDAR ha un raggio di rilevamento più ampio e una maggiore precisione di rilevamento per distanza e posizione, per cui è ampiamente utilizzata nel rilevamento di ostacoli, nell'acquisizione di informazioni ambientali tridimensionali, nel mantenimento della distanza dei veicoli e nell'evitamento degli ostacoli dei veicoli. Tuttavia, il lidar è facilmente influenzato dalle condizioni meteorologiche e le sue prestazioni risultano scarse in caso di pioggia, neve e nebbia. Inoltre, più raggi ha un trasmettitore laser, più nuvole di punti possono essere raccolte al secondo e le prestazioni di rilevamento saranno migliori. Tuttavia, più cablaggi ci sono, più costoso sarà il LiDAR. Un LiDAR con 64 cablaggi costa 10 volte di più di un LiDAR con 16 cablaggi. Attualmente, le auto senza conducente di Baidu e Google sono dotate di radar laser a 64 linee.

Diagramma schematico della nuvola di punti LiDAR

Il radar a onde millimetriche ha un fascio stretto, un'alta risoluzione, una forte capacità anti-interferenza e una forte capacità del cercatore di penetrare nebbia, fumo e polvere. Presenta una migliore adattabilità ambientale rispetto al lidar e le condizioni meteorologiche come pioggia, nebbia o notte non hanno praticamente alcun effetto sulla trasmissione delle onde millimetriche. Inoltre, la sua testa guida presenta le caratteristiche di piccole dimensioni, peso leggero e alta risoluzione spaziale. Con lo sviluppo della tecnologia dei circuiti integrati monolitici a microonde, il prezzo e le dimensioni del radar a onde millimetriche sono diminuiti notevolmente. Tuttavia, la distanza di rilevamento è direttamente limitata dalla perdita di banda di frequenza e il dispositivo non è in grado di rilevare i pedoni e di modellare accuratamente tutti gli ostacoli circostanti.

L'elaborazione dei dati dei sensori a ultrasuoni è semplice e veloce. Vengono utilizzati principalmente per il rilevamento di ostacoli a distanza ravvicinata. La distanza di rilevamento generale è di circa 1-5 metri, ma non è possibile rilevare informazioni dettagliate sulla posizione. Inoltre, quando un'auto viaggia ad alta velocità, l'uso della misurazione della distanza a ultrasuoni non riesce a tenere il passo con le variazioni in tempo reale della distanza tra le auto, con conseguenti grandi errori. D'altro canto, le onde ultrasoniche hanno un ampio angolo di diffusione e una scarsa direttività. Quando si misurano bersagli a lunga distanza, i loro segnali di eco saranno relativamente deboli, il che influirà sulla precisione della misurazione. Tuttavia, nelle misurazioni a bassa velocità e a breve distanza, i sensori di distanza a ultrasuoni presentano grandi vantaggi.

Sensori ad ultrasuoni

I sensori GPS/di navigazione inerziale e di velocità delle ruote vengono utilizzati principalmente per determinare la posizione del veicolo stesso e i loro dati vengono solitamente fusi per migliorare la precisione del posizionamento.

La fusione multisensore è un algoritmo molto comune nei moduli di percezione ambientale. Può ridurre gli errori. Ad esempio, i bordi delle immagini si trovano spesso dove la profondità è discontinua. Estraendo i bordi dell'immagine bidimensionale (ottenuta dalla telecamera) e confrontandoli con le informazioni sulla profondità fornite dal lidar tramite la mappatura co-point, il punto di fuga della strada nell'immagine prospettica bidimensionale può essere confrontato con le informazioni radar tridimensionali. Ciò consente una demarcazione più precisa della superficie stradale e della posizione degli edifici circostanti.

Inoltre, le mappe ad alta precisione rappresentano un valido supporto per la guida autonoma. Se le informazioni sulla mappa sono molto precise, le linee di corsia possono essere pianificate direttamente utilizzando la mappa in una sola volta, il che può ridurre il compito di identificare visivamente le linee di corsia.

Il processo decisionale e la pianificazione sono i "cervelli" della guida autonoma

Diamo un'occhiata a come il gigante delle schede grafiche NVIDA prende decisioni comportamentali per la guida autonoma.

L'attuale quadro decisionale prevalente si divide in due tipologie di algoritmi: il processo decisionale basato su algoritmi esperti e il processo decisionale basato sull'apprendimento automatico; quest'ultimo è sempre più apprezzato e studiato. Ad esempio, NVIDIA utilizza una rete neurale convoluzionale (CNN) per generare i comandi di controllo direzionale dell'auto a partire dalle immagini pixel originali catturate dalla telecamera anteriore dell'auto tramite una rete neurale convoluzionale addestrata. Le auto senza conducente possono circolare su strade non asfaltate, come strade di montagna e cantieri edili. Queste condizioni stradali sono difficili da enumerare, quindi non è realistico affidarsi ai tradizionali algoritmi degli esperti per utilizzare il giudizio condizionale per suddividere le situazioni mutevoli.

Il framework di apprendimento di NVIDIA è il seguente:

I dati di addestramento includono video a fotogramma singolo campionati dal video e i corrispondenti comandi di controllo della direzione. Il comando di controllo direzionale previsto viene confrontato con il comando di controllo ideale, quindi i pesi del modello CNN vengono regolati tramite l'algoritmo di back-propagation per rendere il valore previsto il più vicino possibile al valore ideale. Il modello addestrato può generare comandi di controllo direzionale utilizzando i dati provenienti dalla telecamera che si trova direttamente di fronte a lui.

La struttura più critica della rete neurale convoluzionale (CNN) è la seguente:

L'output è l'inverso del raggio di sterzata e l'input è un'immagine.

Dopo i cinque strati convoluzionali, vengono aggiunti tre strati completamente connessi per simulare il processo decisionale neurale del cervello.

Lo strato convoluzionale (mappa delle feature convoluzionali) viene utilizzato per estrarre le feature e simulare il nervo visivo per distinguere oggetti diversi.

Il primo strato della rete (piani di input normalizzati) normalizza l'immagine di input. La normalizzazione nel modello di rete può adattare il processo di normalizzazione in base alla struttura della rete e il processo di elaborazione può essere accelerato dalla GPU.

La soluzione tecnica di NVIDIA, il metodo decisionale end-to-end dall'input dell'immagine all'output del controllo (angolo del volante), è un sistema a scatola nera. Se si verifica un problema, è impossibile scoprire la causa della decisione sbagliata come farebbe un algoritmo esperto.

Pertanto, una soluzione più fattibile è quella di utilizzare reti neurali per la percezione e la cognizione ambientale, ad esempio per identificare i semafori, le posture delle persone e delle auto, le aree percorribili dei sentieri di montagna, ecc., e quindi inviare le informazioni ambientali elaborate ai decisori per la valutazione. Il tipo di informazione ambientale può essere una mappa che integra informazioni su vari ostacoli oppure una mappa della situazione di guida (vale a dire, indica solo quali aree sono relativamente sicure o pericolose, senza fornire informazioni specifiche su tutti gli ostacoli). Ci sono molte opzioni da provare.

Quale percorso scegliere? La pianificazione del percorso è importante!

La pianificazione del percorso è la base della navigazione e del controllo intelligenti dei veicoli. È considerato dal punto di vista del processo decisionale sulla traiettoria e può essere suddiviso in pianificazione del percorso locale e pianificazione del percorso globale.

Il compito della pianificazione globale del percorso è quello di pianificare un percorso percorribile e privo di collisioni dal punto di partenza al punto di destinazione sulla base delle informazioni presenti nel database della mappa globale, ma si tratta solo di un percorso approssimativo dal punto di partenza al punto di destinazione. Durante l'effettivo processo di guida di un veicolo senza conducente, questo sarà influenzato da fattori quali la direzione, la larghezza, la curvatura, gli incroci stradali e gli ostacoli del percorso, nonché dall'incertezza dell'ambiente locale e dallo stato del veicolo, e pertanto incontrerà varie situazioni imprevedibili. È necessario pianificare un percorso locale ideale senza collisioni sulla base delle informazioni sull'ambiente locale e sulle condizioni del veicolo. Questa è la pianificazione del percorso locale.

La pianificazione locale dei percorsi equivale al "cervello" di un veicolo senza pilota. Ottiene informazioni ambientali, come strade e ostacoli, dal sistema di percezione e ottiene informazioni sulla posizione del punto di partenza e del punto di arrivo fornite dal processo decisionale di livello superiore. Dopo l'elaborazione, genera in tempo reale una traiettoria di guida sicura e fluida. Poiché il percorso del veicolo è una traiettoria con attributi temporali, la pianificazione della traiettoria è solitamente divisa in pianificazione del percorso e pianificazione della velocità. La pianificazione del percorso utilizza spesso l'adattamento della curva spline per soddisfare i vincoli di evitamento degli ostacoli, curvatura massima e continuità della curvatura, mentre la pianificazione della velocità genera una distribuzione della velocità lungo il percorso adattato che soddisfa vincoli quali velocità massima e accelerazione massima. Il piano finale viene trasmesso al sistema di controllo del telaio sotto forma di dati relativi all'angolo di sterzata e alla velocità del veicolo, in modo che quest'ultimo possa mantenere la corsia di marcia e superare gli ostacoli.

Una volta deciso tutto, non resta che muovere il mezzo!

Rispetto ai controller e agli attuatori tradizionali, i veicoli senza conducente preferiscono utilizzare attuatori controllati tramite cavo, come sterzo controllato tramite cavo, frenata controllata tramite cavo e guida controllata tramite cavo, che possono ottenere un controllo preciso.

Nella pianificazione del percorso locale, il veicolo autonomo pianifica un percorso ideale per cambiare corsia dopo aver considerato attentamente l'ambiente circostante, lo stato del veicolo e altri vincoli, e trasmette le istruzioni agli enti esecutivi competenti. Se l'attuatore non riesce a soddisfare i requisiti del percorso per l'angolo di sterzata del veicolo, si discosterà dal percorso pianificato. Per questo motivo, anche l'algoritmo di controllo del movimento è fondamentale.

Quale sarà il trend di sviluppo futuro delle auto senza conducente?

Attualmente esistono due principali percorsi tecnici per i veicoli senza pilota. Uno è il metodo presentato in questo articolo che sfrutta i sensori del veicolo per ottenere diverse informazioni. L'altra è una soluzione basata sulla tecnologia di comunicazione 5G che ottiene informazioni ambientali attraverso la comunicazione in officina e la comunicazione tra veicolo e infrastruttura. Al contrario, il primo non si basa sulla trasformazione delle infrastrutture e sul presupposto che le altre auto sul mercato siano intelligenti, quindi è più facile da realizzare. Sebbene la guida autonoma sia in grado di gestire il 99% delle condizioni stradali in modo relativamente sicuro, il restante 1% richiede il 99% dell'energia degli ingegneri per essere risolto. Prima del 2020, le auto intelligenti dovrebbero ancora essere presentate ai consumatori sotto forma di sistemi ADAS.

Vincitore del Qingyun Plan di Toutiao e del Bai+ Plan di Baijiahao, del Baidu Digital Author of the Year 2019, del Baijiahao's Most Popular Author in the Technology Field, del Sogou Technology and Culture Author 2019 e del Baijiahao Quarterly Influential Creator 2021, ha vinto numerosi premi, tra cui il Sohu Best Industry Media Person 2013, il China New Media Entrepreneurship Competition Beijing 2015, il Guangmang Experience Award 2015, il China New Media Entrepreneurship Competition Finals 2015 e il Baidu Dynamic Annual Powerful Celebrity 2018.

<<:  Potrebbero esserci 32 pericoli nascosti. Il Ministero dei trasporti coreano costringe Hyundai Kia a richiamare 240.000 veicoli

>>:  Non fatevi spaventare da loro quando visitate il mercato notturno il giorno della Festa Nazionale...

Consiglia articoli

Sbarazzati del grasso delle cosce e solleva i glutei con 5 elastici

Le cosce grasse delle ragazze saranno visibili no...

Per la cura dell'ipertensione, basta leggere questo articolo!

L'immagine proviene da Internet Negli ultimi ...

Conto alla rovescia per i "Tre Test": i "Tre Must" della Dieta Scientifica

È iniziato il conto alla rovescia per l'esame...

Rivedere la commovente canzone "My Valentine's Day"

"Il mio San Valentino": una storia d...

Che ne dici di Yundis? Recensioni e informazioni sul sito web di Yundisi

Cos'è il sito web Yundis? Wendy's è la ter...

Dieta ragionevole e nutrizione equilibrata: la pietra angolare di una vita sana

Nella società moderna, le persone prestano sempre...