[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE102019114867A1 - Autonome fahrentscheidungen an kreuzungen unter verwendung eines hierarchischen optionalen markov-entscheidungsprozesses - Google Patents

Autonome fahrentscheidungen an kreuzungen unter verwendung eines hierarchischen optionalen markov-entscheidungsprozesses Download PDF

Info

Publication number
DE102019114867A1
DE102019114867A1 DE102019114867.7A DE102019114867A DE102019114867A1 DE 102019114867 A1 DE102019114867 A1 DE 102019114867A1 DE 102019114867 A DE102019114867 A DE 102019114867A DE 102019114867 A1 DE102019114867 A1 DE 102019114867A1
Authority
DE
Germany
Prior art keywords
action
vehicle
obstacle
discrete
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102019114867.7A
Other languages
English (en)
Inventor
Praveen Palanisamy
Zhiqian Qiao
Katharina Muelling
John M. Dolan
Upali P. Mudalige
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Carnegie Mellon University
GM Global Technology Operations LLC
Original Assignee
Carnegie Mellon University
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Carnegie Mellon University, GM Global Technology Operations LLC filed Critical Carnegie Mellon University
Publication of DE102019114867A1 publication Critical patent/DE102019114867A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

Es ist ein Verfahren in einem autonomen Fahrzeug (AV) vorgesehen. Das Verfahren beinhaltet das Bestimmen einer Vielzahl von Entfernungsmessungen und Hindernisgeschwindigkeitsdaten aus Fahrzeugsensordaten und Straßengeometriedaten; das Bestimmen von Fahrzeugzustandsdaten, worin die Fahrzeugzustandsdaten eine Geschwindigkeit des AV, eine Entfernung zu einer Haltelinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel beinhalten; Bestimmen, basierend auf der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten, eines Satzes von diskreten Verhaltensaktionen und einer eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist; Auswählen einer diskreten Verhaltensaktion und einer auszuführenden eindeutigen Trajektorien-Steuerungsaktion; und Übermitteln einer Nachricht an Fahrzeugsteuerungen, welche die eindeutige Trajektorien-Steuerungsaktion, die der diskreten Verhaltensaktion zugeordnet ist, übermitteln.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Offenbarung bezieht sich im Allgemeinen auf autonom fahrende Fahrzeuge, und insbesondere auf Systeme und Verfahren zur Entscheidungsfindung in einem autonomen Fahrzeug an einer Kreuzung.
  • HINTERGRUND
  • Ein autonomes Fahrzeug (AV) ist ein Fahrzeug, das in der Lage ist, seine Umgebung zu erfassen und mit wenig oder keiner Benutzereingabe zu navigieren. Dies geschieht durch den Einsatz von Sensoren, wie beispielsweise Radar, Lidar, Bildsensoren und dergleichen. Autonome Fahrzeuge nutzen weiterhin Informationen von globalen Positioniersystemen (GPS), Navigationssystemen, Fahrzeug-Fahrzeug-Kommunikationen, Fahrzeug-Infrastruktur-Technologien und/oder drahtgesteuerten Systemen, um das Fahrzeug zu navigieren.
  • Während in den letzten Jahren signifikante Fortschritte bei autonomen Fahrzeugen erzielt wurden, könnten diese Fahrzeuge in einer Reihe von Aspekten noch verbessert werden. So können beispielsweise die Steueralgorithmen in einem autonomen Fahrzeug nicht zum Bestimmen von Maßnahmen optimiert werden, die zu ergreifen sind, wenn sich ein autonomes Fahrzeug an einer Kreuzung befindet. Als weiteres Beispiel, kann die Überquerung einer Vierwege-Kreuzung mit Zweiwege-Halteschildern für autonome Fahrzeuge schwierig sein. Nach der Ankunft muss das Fahrzeug seine Aktionen richtig planen, um sicher auf der Vorfahrtsstraße abzubiegen. Wenn das Fahrzeug zu früh in die Kreuzung einfährt, kann es zu einer Kollision kommen oder dazu führen, dass die sich nähernden vorfahrtsberechtigten Fahrzeuge stark bremsen. Andererseits, wenn das Fahrzeug zu lange wartet, um sicherzustellen, dass es für das Fahrzeug sicher ist, kann wertvolle Zeit verloren gehen. Es kann für ein autonomes Fahrzeug schwierig sein, die Zeit, die ein sich näherndes Fahrzeug benötigt, um eine Kreuzung zu erreichen und zu überqueren, genau zu schätzen und die Entscheidung des autonomen Fahrzeugs anzupassen, wenn unerwartete Veränderungen in der Umgebung auftreten.
  • Dementsprechend ist es wünschenswert, Systeme und Verfahren zur Verbesserung des Entscheidungsverfahrens in einem autonomen Fahrzeug an einer Kreuzung bereitzustellen. Ferner werden andere wünschenswerte Funktionen und Merkmale der vorliegenden Erfindung aus der nachfolgenden ausführlichen Beschreibung und den beigefügten Ansprüchen, in Verbindung mit den beigefügten Zeichnungen, sowie mit dem vorangehenden technischen Gebiet und Hintergrund ersichtlich offensichtlich.
  • KURZDARSTELLUNG
  • Systeme und Verfahren sind in einem autonomen Fahrzeug vorgesehen, um über Maßnahmen an einer Kreuzung zu entscheiden. In einer Ausführungsform wird ein prozessorimplementiertes Verfahren in einem autonomen Fahrzeug (AV) zum Ausführen eines Manövers an einer Kreuzung bereitgestellt. Das Verfahren beinhaltet das Bestimmen einer Vielzahl von Entfernungsmessungen durch einen Prozessor aus Fahrzeugsensordaten und Straßengeometriedaten, worin jede Entfernungsmessung von einem einzigartigen Strahl bestimmt wird, der sich von einem Startpunkt auf dem AV bis zu einem Endpunkt erstreckt, der durch ein Hindernis im Weg dieses Strahls oder eine vorbestimmte maximale Entfernung beendet wird. Das Verfahren beinhaltet ferner: Bestimmen von Hindernisgeschwindigkeitsdaten durch den Prozessor aus Fahrzeugsensordaten, worin die Hindernisgeschwindigkeitsdaten eine Geschwindigkeit eines Hindernisses beinhalten, das bestimmt wurde, um sich am Endpunkt der Strahlen zu befinden; Bestimmen von Fahrzeugzustandsdaten durch den Prozessor, worin die Fahrzeugzustandsdaten eine Geschwindigkeit des AV, einen Abstand zu einer Stopplinie, einen Abstand zu einem Mittelpunkt einer Kreuzung und einen Abstand zu einem Ziel beinhalten; Bestimmen, durch den Prozessor basierend auf der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten, eines Satzes von diskreten Verhaltensaktionen und einer eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist; Auswählen einer diskreten Verhaltensaktion durch den Prozessor aus dem Satz von diskreten Verhaltensaktionen und der zugehörigen eindeutigen Trajektorien-Steuerungsaktion zum Ausführen; und Übermitteln einer Nachricht an Fahrzeugsteuerungen durch den Prozessor, welche die ausgewählte eindeutige Trajektorien-Steuerungsaktion, die der diskreten Verhaltensaktion zugeordnet ist, übermittelt.
  • In einer Ausführungsform beinhaltet das Bestimmen einer Vielzahl von Entfernungsmessungen und die Bestimmen der Hindernisgeschwindigkeitsdaten: Konstruieren eines computererzeugten virtuellen Rasters um das AV herum, wobei sich die Mitte des virtuellen Rasters an einer mittleren Vorderseite des AV befindet; Unterteilen des virtuellen Rasters in eine Vielzahl von Teilraster; Zuweisen einer belegten Eigenschaft zu einem Teilraster, wenn sich ein Hindernis oder sich bewegendes Objekt in dem durch das Teilraster dargestellten Bereich befindet; Verfolgen einer Vielzahl von linearen Strahlen, die von der Mittelfront des AV in einer Vielzahl von einzigartigen Winkeln ausgestrahlt werden, die die Vorderseite des AV bedecken, durch das virtuelle Gitter, wobei jeder Strahl an der Mittelfront des AV beginnt und endet, wenn er ein besetztes Teilraster erreicht, das ein Hindernis oder eine vorbestimmte Entfernung anzeigt; und Bestimmen, für jeden Strahl, der Abstand dieses Strahls und die Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls.
  • In einer Ausführungsform beinhaltet das Bestimmen des Satzes von diskreten Verhaltensaktionen und der einzigartigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist, das Erzeugen eines Zustandsvektors, der die Fahrzeugzustandsdaten, den Abstand jedes Strahls und die Geschwindigkeit von Hindernissen an den Endpunkten der Strahlen beinhaltet.
  • In einer Ausführungsform beinhaltet das Bestimmen des Satzes von diskreten Verhaltensaktionen und der eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist, ferner das Anwenden des Zustandsvektors als Eingabe in ein neuronales Netzwerk, das konfiguriert ist, um den Satz von diskreten Verhaltensaktionen und die eindeutige Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist, zu berechnen.
  • In einer Ausführungsform beinhaltet das neuronale Netzwerk: ein hierarchisches Optionsnetzwerk, das konfiguriert ist, um zwei hierarchische Optionskandidaten zu erzeugen, worin die beiden hierarchischen Optionskandidaten jeweils einen Vertrauensoptionskandidaten und einen nicht vertrauenswürdigen Optionskandidaten beinhalten; ein Aktionsnetzwerk, das konfiguriert ist, um kontinuierliche Aktionsauswahlen auf niedrigerer Ebene für Beschleunigung und Verzögerung zu erzeugen; und ein Q-Wertnetzwerk, das konfiguriert ist, um Q-Werte zu erzeugen, die den kontinuierlichen Aktionsauswahlen auf niedrigerer Ebene für Beschleunigung und Verzögerung entsprechen.
  • In einer Ausführungsform beinhaltet das Verfahren ferner: das Entscheiden unter Verwendung der hierarchischen Optionskandidaten, dass das AV der Umgebung vertrauen kann; und das Entscheiden, die einzigartige Trajektorien-Steuerungsaktion, die durch das neuronale Netzwerk bereitgestellt wird, zu implementieren.
  • In einer Ausführungsform beinhaltet das neuronale Netzwerk: ein hierarchisches Optionsnetzwerk, auf das ein Eingangszustandsvektor st von drei vollständig verbundenen (FC)-Schichten gefolgt wird, um eine Q-Wert-Matrix Ot zu erzeugen, die zwei hierarchischen Optionskandidaten entspricht; ein Aktionsnetzwerk, auf das der Eingangszustandsvektor st von vier FC-Schichten zum Erzeugen eines kontinuierlichen Aktionsvektors at folgt; und ein Q-Wertnetzwerk, das die Ausgabe einer Verkettung des Eingangszustandsvektors st empfängt, gefolgt von einer FC-Schicht mit dem kontinuierlichen Aktionsvektor at gefolgt von einer FC-Schicht, worin das Q-Wertnetzwerk so konfiguriert ist, dass es über vier FC-Schichten einen Q-Wertevektor Qt erzeugt, der dem Aktionsvektor at entspricht.
  • In einer Ausführungsform beinhaltet die Wahl einer diskreten Verhaltensaktion und einer einzigartigen Trajektorien-Steuerungsaktion: das Modellieren einer Auswahl von Aktionen als Markov-Entscheidungsprozess (MDP); das Erlernen einer optimalen Richtlinie über das neuronale Netzwerk unter Verwendung von Verstärkungslernen; und die Implementierung der optimalen Richtlinie, um das Manöver an der Kreuzung zu beenden.
  • In einer Ausführungsform beinhaltet das Manöver eines von einem Durchfahren der Kreuzung geradeaus, einem Linksabbiegen an der Kreuzung oder einem Rechtsabbiegen an der Kreuzung.
  • In einer anderen Ausführungsform ist ein System in einem autonomen Fahrzeug (AV) zum Ausführen eines Manövers an einer Kreuzung vorgesehen. Das System beinhaltet ein Kreuzungsmanövermodul, das einen oder mehrere Prozessoren beinhaltet, die durch Programmieranweisungen konfiguriert sind, die in nicht-flüchtigen, computerlesbaren Medien kodiert sind. Das Kreuzungsmanövermodul ist konfiguriert zum: Bestimmen einer Vielzahl von Entfernungsmessungen aus Fahrzeugsensordaten und Straßengeometriedaten, worin jede Entfernungsmessung von einem einzigartigen Strahl bestimmt wird, der sich von einem Startpunkt auf dem AV zu einem Endpunkt erstreckt, der durch ein Hindernis im Weg dieses Strahls oder eine vorbestimmte maximale Entfernung beendet wird; Bestimmen von Hindernisgeschwindigkeitsdaten aus Fahrzeugsensordaten, worin die Hindernisgeschwindigkeitsdaten eine Geschwindigkeit eines Hindernisses beinhalten, das sich am Endpunkt der Strahlen befindlich bestimmt wurde; Bestimmen von Fahrzeugzustandsdaten, worin die Fahrzeugzustandsdaten eine Geschwindigkeit des AV, eine Entfernung zu einer Haltelinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel beinhalten; Bestimmen, basierend auf der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten, eines Satzes von diskreten Verhaltensaktionen und einer eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist; Auswählen einer diskreten Verhaltensaktion aus dem Satz von diskreten Verhaltensaktionen und der zugehörigen eindeutigen Trajektorien-Steuerungsaktion zum Ausführen; und Übermitteln einer Nachricht an Fahrzeugsteuerungen, welche die ausgewählte eindeutige Trajektorien-Steuerungsaktion, die der diskreten Verhaltensaktion zugeordnet ist, übermitteln.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul konfiguriert, um eine Vielzahl von Entfernungsmessungen zu bestimmen und Hindernisgeschwindigkeitsdaten zu bestimmen, durch: Konstruieren eines computererzeugten virtuellen Rasters um das AV herum mit einer Mitte des virtuellen Rasters, die sich an einer mittleren Vorderseite des AV befindet; Unterteilen des virtuellen Rasters in eine Vielzahl von Teilraster; Zuordnen einer belegten Eigenschaft zu einem Teilraster, wenn sich ein Hindernis oder ein sich bewegendes Objekt in dem durch das Teilraster dargestellten Bereich befindet; Verfolgen einer Vielzahl von linearen Strahlen, die von einer Mittelfront des AV in einer Vielzahl von einzigartigen Winkeln ausgestrahlt werden, welche die Vorderseite des AV bedecken, durch das virtuelle Raster, worin jeder Strahl an der Mittelfront des AV beginnt und endet, wenn er ein besetztes Teilgitter erreicht, das ein Hindernis oder eine vorbestimmte Entfernung anzeigt; und Bestimmen, für jeden Strahl, der Entfernung dieses Strahls und der Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul konfiguriert, um einen Satz von diskreten Verhaltensaktionen und eine einzigartige Trajektorien-Steuerungsaktion zu bestimmen, die jeder diskreten Verhaltensaktion zugeordnet ist, indem ein Zustandsvektor erzeugt wird, der die Fahrzeugzustandsdaten, den Abstand jedes Strahls und die Geschwindigkeit von Hindernissen an den Endpunkten der Strahlen beinhaltet.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul konfiguriert, um einen Satz von diskreten Verhaltensaktionen und eine eindeutige Trajektorien-Steuerungsaktion zu bestimmen, die jeder diskreten Verhaltensaktion zugeordnet ist, indem der Zustandsvektor als Eingabe in ein neuronales Netzwerk angewendet wird, das konfiguriert ist, um den Satz von diskreten Verhaltensaktionen und die eindeutige Trajektorien-Steuerungsaktion zu berechnen, die jeder diskreten Verhaltensaktion zugeordnet ist.
  • In einer Ausführungsform beinhaltet das neuronale Netzwerk: ein hierarchisches Optionsnetzwerk, das konfiguriert ist, um zwei hierarchische Optionskandidaten zu erzeugen, worin die beiden hierarchischen Optionskandidaten jeweils einen Vertrauensoptionskandidaten und einen nicht vertrauenswürdigen Optionskandidaten beinhalten; ein Aktionsnetzwerk, das konfiguriert ist, um kontinuierliche Aktionsauswahlen auf niedrigerer Ebene für Beschleunigung und Verzögerung zu erzeugen; und ein Q-Wertnetzwerk, das konfiguriert ist, um Q-Werte zu erzeugen, die den kontinuierlichen Aktionsauswahlen auf niedrigerer Ebene für Beschleunigung und Verzögerung entsprechen.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul ferner konfiguriert, um: unter Verwendung der hierarchischen Optionskandidaten zu entscheiden, dass das AV der Umgebung vertrauen kann; und zu entscheiden, die einzigartige Trajektorien-Steuerungsaktion, die durch das neuronale Netzwerk bereitgestellt wird, zu implementieren.
  • In einer Ausführungsform beinhaltet das neuronale Netzwerk: ein hierarchisches Optionsnetzwerk, auf das ein Eingangszustandsvektor st von drei vollständig verbundenen (FC)-Schichten gefolgt wird, um eine Q-Wert-Matrix Ot zu erzeugen, die zwei hierarchischen Optionskandidaten entspricht; ein Aktionsnetzwerk, auf das der Eingangszustandsvektor st von vier FC-Schichten zum Erzeugen eines kontinuierlichen Aktionsvektors at folgt; und ein Q-Wertnetzwerk, das die Ausgabe einer Verkettung des Eingangszustandsvektors st empfängt, gefolgt von einer FC-Schicht mit dem kontinuierlichen Aktionsvektor at gefolgt von einer FC-Schicht, worin das Q-Wertnetzwerk so konfiguriert ist, dass es über vier FC-Schichten einen Q-Wertevektor Qt erzeugt, der dem Aktionsvektor at entspricht.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul konfiguriert, um eine diskrete Verhaltensaktion und eine einzigartige Trajektorien-Steuerungsaktion auszuwählen, die ausgeführt werden kann, durch: Modellieren einer Auswahl von Aktionen als Markov-Entscheidungsprozess (MDP); das Erlernen einer optimalen Richtlinie über das neuronale Netzwerk unter Verwendung von Verstärkungslernen; und die Implementierung der optimalen Richtlinie, um das Manöver an der Kreuzung zu beenden.
  • In einer weiteren Ausführungsform ist ein autonomes Fahrzeug (AV) vorgesehen. Der AV beinhaltet eine oder mehrere Sensorvorrichtungen, die konfiguriert sind, um Fahrzeugsensordaten zu erzeugen, sowie ein Kreuzungsmanövermodul. Das Kreuzungsmanövermodul ist konfiguriert zum: Bestimmen einer Vielzahl von Entfernungsmessungen aus Fahrzeugsensordaten und Straßengeometriedaten, worin jede Entfernungsmessung von einem einzigartigen Strahl bestimmt wird, der sich von einem Startpunkt auf dem AV zu einem Endpunkt erstreckt, der durch ein Hindernis im Weg dieses Strahls oder eine vorbestimmte maximale Entfernung beendet wird; Bestimmen von Hindernisgeschwindigkeitsdaten aus Fahrzeugsensordaten, worin die Hindernisgeschwindigkeitsdaten eine Geschwindigkeit eines Hindernisses beinhalten, das sich am Endpunkt der Strahlen befindlich bestimmt wurde; Bestimmen von Fahrzeugzustandsdaten, worin die Fahrzeugzustandsdaten eine Geschwindigkeit des AV, eine Entfernung zu einer Haltelinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel beinhalten; Bestimmen, basierend auf der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten, eines Satzes von diskreten Verhaltensaktionen und einer eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist; Auswählen einer diskreten Verhaltensaktion aus dem Satz von diskreten Verhaltensaktionen und der zugehörigen eindeutigen Trajektorien-Steuerungsaktion zum Ausführen; und Übermitteln einer Nachricht an Fahrzeugsteuerungen, welche die ausgewählte eindeutige Trajektorien-Steuerungsaktion, die der diskreten Verhaltensaktion zugeordnet ist, übermitteln.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul konfiguriert, um eine Vielzahl von Entfernungsmessungen zu bestimmen und Hindernisgeschwindigkeitsdaten zu bestimmen, durch: Konstruieren eines computererzeugten virtuellen Rasters um das AV herum mit einer Mitte des virtuellen Rasters, die sich an einer mittleren Vorderseite des AV befindet; Unterteilen des virtuellen Rasters in eine Vielzahl von Teilraster; Zuordnen einer belegten Eigenschaft zu einem Teilraster, wenn sich ein Hindernis oder ein sich bewegendes Objekt in dem durch das Teilraster dargestellten Bereich befindet; Verfolgen einer Vielzahl von linearen Strahlen, die von einer Mittelfront des AV in einer Vielzahl von einzigartigen Winkeln ausgestrahlt werden, welche die Vorderseite des AV bedecken, durch das virtuelle Raster, worin jeder Strahl an der Mittelfront des AV beginnt und endet, wenn er ein besetztes Teilgitter erreicht, das ein Hindernis oder eine vorbestimmte Entfernung anzeigt; und Bestimmen, für jeden Strahl, der Entfernung dieses Strahls und der Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls.
  • In einer Ausführungsform ist das Kreuzungsmanövermodul konfiguriert, um einen Satz von diskreten Verhaltensaktionen und eine eindeutige Trajektorien-Steuerungsaktion zu bestimmen, durch: Erzeugen eines Zustandsvektors, der die Fahrzeugzustandsdaten, den Abstand jedes Strahls und die Geschwindigkeit von Hindernissen an den Endpunkten der Strahlen beinhaltet; und Anwenden des Zustandsvektors als Eingabe in ein neuronales Netzwerk, das konfiguriert ist, um den Satz von diskreten Verhaltensaktionen und die eindeutige Traj ektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist, zu berechnen. In einer Ausführungsform beinhaltet das neuronale Netzwerk: ein hierarchisches Optionsnetzwerk, auf das ein Eingangszustandsvektor st von drei vollständig verbundenen (FC)-Schichten gefolgt wird, um eine Q-Wert-Matrix Ot zu erzeugen, die zwei hierarchischen Optionskandidaten entspricht; ein Aktionsnetzwerk, auf das der Eingangszustandsvektor st von vier FC-Schichten zum Erzeugen eines kontinuierlichen Aktionsvektors at folgt; und ein Q-Wertnetzwerk, das die Ausgabe einer Verkettung des Eingangszustandsvektors st empfängt, gefolgt von einer FC-Schicht mit dem kontinuierlichen Aktionsvektor at gefolgt von einer FC-Schicht, worin das Q-Wertnetzwerk so konfiguriert ist, dass es über vier FC-Schichten einen Q-Wertevektor Qt erzeugt, der dem Aktionsvektor at entspricht.
  • Figurenliste
  • Die exemplarischen Ausführungsformen werden nachfolgend in Verbindung mit den folgenden Zeichnungen beschrieben, worin gleiche Bezugszeichen gleiche Elemente bezeichnen, und worin gilt:
    • 1 ist ein Funktionsblockdiagramm, das ein autonomes Fahrzeug mit einem Kreuzungsmanövermodul gemäß verschiedenen Ausführungsformen veranschaulicht;
    • 2 ist ein Funktionsblockdiagramm, das ein autonomes Antriebssystem (ADS) in Verbindung mit einem autonomen Fahrzeug gemäß verschiedenen Ausführungsformen veranschaulicht;
    • 3 ist ein Blockdiagramm, das ein exemplarisches Kreuzungsmanövermodul in einem exemplarischen Fahrzeug gemäß verschiedenen Ausführungsformen abbildet;
    • 4 ist ein Diagramm, das ein exemplarisches Betriebsszenario darstellt, das für das Verständnis der Strahlverfolgung gemäß verschiedenen Ausführungsformen nützlich sein kann,
    • 5 ist ein Prozessablaufdiagramm, das einen exemplarischen Prozess in einem Fahrzeug zum Auswählen von Fahrzeugaktionen an einer Kreuzung abbildet, gemäß verschiedenen Ausführungsformen; und
    • 6 ist ein Prozessablaufdiagramm, das einen exemplarischen Prozess zur Strahlverfolgung beim Bestimmen von Entfernungsmessungen und der Geschwindigkeit von Hindernissen am Endpunkt der für Entfernungsmessungen verwendeten Strahlen gemäß verschiedenen Ausführungsformen abbildet.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Die folgende ausführliche Beschreibung dient lediglich als Beispiel und soll die Anwendung und Verwendung in keiner Weise einschränken. Weiterhin besteht keine Absicht, im vorstehenden technischen Bereich, Hintergrund, der Zusammenfassung oder der folgenden ausführlichen Beschreibung an eine ausdrücklich oder implizit vorgestellte Theorie gebunden zu sein. Der hierin verwendete Begriff „Modul“ bezieht sich auf alle Hardware-, Software-, Firmwareprodukte, elektronische Steuerkomponenten, Verarbeitungslogik und/oder Prozessorgeräte, einzeln oder in allen Kombinationen, unter anderem beinhaltend, eine anwendungsspezifische integrierte Schaltung (ASIC), ein feldprogrammierbares Gate-Array (FPGA), eine elektronische Schaltung, einen Prozessor (gemeinsam genutzt, dediziert oder Gruppenprozessor) und einen Speicher, der ein oder mehrere Software- oder Firmwareprogramme, eine kombinatorische Logikschaltung und/oder andere geeignete Komponenten ausführt, welche die beschriebene Funktionalität bieten.
  • Ausführungsformen der vorliegenden Offenbarung können hierin als funktionale und/oder logische Blockkomponenten und verschiedene Verarbeitungsschritte beschrieben sein. Es ist zu beachten, dass derartige Blockkomponenten aus einer beliebigen Anzahl an Hardware-, Software- und/oder Firmware-Komponenten aufgebaut sein können, die zur Ausführung der erforderlichen Funktionen konfiguriert sind. Zum Beispiel kann eine Ausführungsform der vorliegenden Offenbarung eines Systems oder einer Komponente verschiedene integrierte Schaltungskomponenten, z. B. Speicherelemente, digitale Signalverarbeitungselemente, Logikelemente, Wertetabellen oder dergleichen, einsetzen, die mehrere Funktionen unter der Steuerung eines oder mehrerer Mikroprozessoren oder anderer Steuervorrichtungen durchführen können. Zudem werden Fachleute auf dem Gebiet erkennen, dass die Ausführungsformen der vorliegenden Offenbarung in Verbindung mit einer beliebigen Anzahl an Systemen eingesetzt werden können, und dass die hierin beschriebenen Systeme lediglich exemplarische Ausführungsformen der vorliegenden Offenbarung darstellen.
  • Der Kürze halber können konventionelle Techniken in Verbindung mit der Signalverarbeitung, Datenübertragung, Signalgebung, Steuerung, Maschinenlernmodelle, Radar, Lidar, Bildanalyse und weiteren funktionalen Aspekten der Systeme (und den einzelnen Bedienkomponenten der Systeme) hierin nicht im Detail beschrieben werden. Weiterhin sollen die in den verschiedenen Figuren dargestellten Verbindungslinien exemplarische Funktionsbeziehungen und/oder physikalische Verbindungen zwischen den verschiedenen Elementen darstellen. Es sollte beachtet werden, dass viele alternative oder zusätzliche funktionale Beziehungen oder physikalische Verbindungen in einer Ausführungsform der vorliegenden Offenbarung vorhanden sein können.
  • 1 bildet ein exemplarisches Fahrzeug 100 mit einem Kreuzungsmanövermodul ab, das im Allgemein als 102 dargestellt ist. Im Allgemeinen bestimmt das Kreuzungsmanövermodul 102, wie sich das Fahrzeug 100 beim Erreichen einer Kreuzung verhalten soll, damit die Fahrzeugsteuerung das Fahrzeug 100 zum Manövrieren an der Kreuzung manövrieren kann.
  • Das Fahrzeug 100 beinhaltet im Allgemeinen ein Fahrgestell 12, eine Karosserie 14, Vorderräder 16 und Hinterräder 18. Die Karosserie 14 ist auf dem Fahrgestell 12 angeordnet und umhüllt im Wesentlichen die anderen Komponenten des Fahrzeugs 100. Die Karosserie 14 und das Fahrgestell 12 können gemeinsam einen Rahmen bilden. Die Räder 16-18 sind jeweils mit dem Fahrgestell 12 in der Nähe einer jeweiligen Ecke der Karosserie 14 drehbar gekoppelt.
  • In verschiedenen Ausführungsformen ist das Fahrzeug 100 ein Fahrzeug, das autonom oder halbautonom angetrieben werden kann, nachstehend als autonomes Fahrzeug (AV) bezeichnet. Das AV 100 ist beispielsweise ein Fahrzeug, das automatisch gesteuert werden kann, um Passagiere von einem Ort zum anderen zu befördern. Das Fahrzeug 100 ist in der veranschaulichten Ausführungsform als Pkw dargestellt, wobei jedoch auch jedes andere Fahrzeug einschließlich Motorräder, Lastwagen, Sportfahrzeuge (SUVs), Freizeitfahrzeuge (RVs), Schiffe, Flugzeuge usw. verwendet werden kann.
  • Wie dargestellt, beinhaltet das Fahrzeug 100 im Allgemeinen ein Antriebssystem 20, ein Übertragungssystem 22, ein Lenksystem 24, ein Bremssystem 26, ein Sensorsystem 28, ein Stellgliedsystem 30, mindestens einen Datenspeicher 32, mindestens eine Steuerung 34 und ein Kommunikationssystem 36. Das Antriebssystem 20 kann in verschiedenen Ausführungsformen einen Verbrennungsmotor, eine elektrische Maschine, wie beispielsweise einen Traktionsmotor und/oder ein Brennstoffzellenantriebssystem, beinhalten.
  • Das Lenksystem 24 beeinflusst eine Position der Fahrzeugräder 16 und/oder 18. Während in einigen Ausführungsformen innerhalb des Umfangs der vorliegenden Offenbarung zur Veranschaulichung als ein Lenkrad 25 dargestellt, kann das Lenksystem 24 kein Lenkrad beinhalten. Das Lenksystem 24 ist konfiguriert, um Steuerbefehle von der Steuerung 34 zu empfangen, wie beispielsweise Lenkwinkel- oder Drehmomentbefehle, die bewirken, dass das Fahrzeug 100 die gewünschten Trajektorien-Wegpunkte erreicht. Das Lenksystem 24 kann beispielsweise ein elektrisches Servolenkungssystem (EPS) oder ein aktives Frontlenkungssystem (AFS) sein.
  • Das Sensorsystem 28 beinhaltet eine oder mehrere Sensorvorrichtungen 40a-40n, die beobachtbare Zustände der äußeren Umgebung und/oder der inneren Umgebung des Fahrzeugs 100 (zum Beispiel den Zustand eines oder mehrerer Insassen) erfassen und entsprechende Sensordaten erzeugen. Sensorvorrichtungen 40a-40n können, sind jedoch nicht beschränkt auf, Radare (z. B. Langstrecken-, Mittelstrecken-Kurzbereich), Lidare, globale Positionierungssysteme (GPS), optische Kameras (z. B. nach vorne gerichtet, 360-Grad, nach hinten gerichtet, seitlich gerichtet, Stereo, usw.), beinhalten, Wärmebildkameras (z. B. Infrarot), Ultraschallsensoren, Geschwindigkeitsmesssensoren (z. B. Encoder) und/oder andere Sensoren, die in Verbindung mit Systemen und Verfahren gemäß dem vorliegenden Gegenstand verwendet werden können.
  • Das Stellgliedsystem 30 beinhaltet ein oder mehrere Stellgliedvorrichtungen 42a-42n, die ein oder mehrere Fahrzeugeigenschaften, wie zum Beispiel das Antriebssystem 20, das Getriebesystem 22, das Lenksystem 24 und das Bremssystem 26, steuern, sind aber nicht darauf beschränkt.
  • Die Datenspeichervorrichtung 32 speichert Daten zur Verwendung beim automatischen Steuern des Fahrzeugs 100. In verschiedenen Ausführungsformen speichert das Datenspeichergerät 32 definierte Landkarten der navigierbaren Umgebung. In verschiedenen Ausführungsformen können die definierten Landkarten vordefiniert und von einem entfernten System abgerufen werden. So können beispielsweise die definierten Landkarten durch das entfernte System zusammengesetzt und dem Fahrzeug 100 (drahtlos und/oder drahtgebunden) mitgeteilt und in der Datenspeichervorrichtung 32 gespeichert werden. Routeninformationen können auch in der Datenspeichervorrichtung 32 gespeichert werden - d. h. in einer Reihe von Straßenabschnitten (die geografisch mit einer oder mehreren der definierten Karten verknüpft sind), die zusammen eine Route definieren, die der Benutzer von einem Startort (z. B. dem aktuellen Standort des Benutzers) zu einem Zielort zurücklegen kann. Wie ersichtlich, kann die Datenspeichervorrichtung 32 ein Teil der Steuerung 34, von der Steuerung 34 getrennt, oder ein Teil der Steuerung 34 und Teil eines separaten Systems sein.
  • Die Steuerung 34 beinhaltet mindestens einen Prozessor 44 und eine computerlesbare Speichervorrichtung oder Medien 46. Der Prozessor 44 kann eine Spezialanfertigung oder ein handelsüblicher Prozessor sein, eine Zentraleinheit (CPU), eine Grafikprozessoreinheit (GPU), eine anwendungsspezifische integrierte Schaltung (ASIC) (z. B. eine benutzerdefinierte ASIC, die ein neuronales Netzwerk implementiert), ein feldprogrammierbares Gate-Array (FPGA), ein Hilfsprozessor unter mehreren Prozessoren, verbunden mit der Steuerung 34, ein Mikroprozessor auf Halbleiterbasis (in Form eines Mikrochips oder Chip-Satzes) eine Kombination derselben oder allgemein jede beliebige Vorrichtung zur Ausführung von Anweisungen. Die computerlesbare Speichervorrichtung oder Medien 46 können flüchtige und nicht-flüchtige Speicher in einem Nur-Lese-Speicher (ROM), einem Speicher mit direktem Zugriff (RAM) und einem Keep-Alive-Memory (KAM) beinhalten. KAM ist ein persistenter oder nicht-flüchtiger Speicher, der verwendet werden kann, um verschiedene Betriebsvariablen zu speichern, während der Prozessor 44 ausgeschaltet ist. Die computerlesbare Speichervorrichtung oder Medien 46 können unter Verwendung einer beliebigen einer Anzahl an bekannten Speichervorrichtungen, wie beispielsweise PROMs (programmierbarer Nur-Lese-Speicher), EPROMs (elektrische PROM), EEPROMs (elektrisch löschbarer PROM), Flash-Speicher oder beliebige andere elektrischen, magnetischen, optischen oder kombinierten Speichervorrichtungen, implementiert werden, die Daten speichern können, von denen einige ausführbare Anweisungen darstellen, die von der Steuerung 34 beim Steuern des Fahrzeugs 100 verwendet werden. In verschiedenen Ausführungsformen ist die Steuerung 34 konfiguriert, um das im Folgenden ausführlich erläuterte Kartierungssystem zu implementieren.
  • Die Anweisungen können ein oder mehrere separate Programme beinhalten, von denen jede eine geordnete Auflistung von ausführbaren Anweisungen zum Implementieren von logischen Funktionen umfasst. Die Anweisungen empfangen und verarbeiten, wenn diese vom Prozessor 44 ausgeführt werden, Signale (z. B. Sensordaten) vom Sensorsystem 28, führen Logik, Berechnungen, Verfahren und/oder Algorithmen zur automatischen Steuerung der Komponenten des Fahrzeugs 100 durch und erzeugen Steuersignale, die an das Stellgliedsystem 30 übertragen werden, um die Komponenten des Fahrzeugs 100 basierend auf der Logik, den Berechnungen, den Verfahren und/oder Algorithmen automatisch zu steuern. Obwohl in 1 nur eine Steuerung 34 dargestellt ist, können Ausführungsformen des Fahrzeugs 100 eine beliebige Anzahl an Steuerungen 34 beinhalten, die über ein geeignetes Kommunikationsmedium oder eine Kombination von Kommunikationsmedien kommunizieren und zusammenwirken, um die Sensorsignale zu verarbeiten, Logiken, Berechnungen, Verfahren und/oder Algorithmen durchzuführen, und Steuersignale zu erzeugen, um die Funktionen des autonomen Fahrzeugs 100 automatisch zu steuern.
  • Gemäß verschiedenen Ausführungsformen realisiert die Steuerung 34 ein autonomes oder halbautonomes Antriebssystem 70, wie in 2 dargestellt. Das heißt, dass geeignete Soft- und/oder Hardwarekomponenten der Steuerung 34 (z. B. der Prozessor 44 und die computerlesbare Speichervorrichtung 46) verwendet werden, um ein autonomes halbautonomes Antriebssystem 70 bereitzustellen.
  • In verschiedenen Ausführungsformen können die Anweisungen des autonomen oder halbautonomen Antriebssystems 70 je nach Funktion oder System gegliedert sein. Das autonome oder halbautonome Antriebssystem 70 kann beispielsweise, wie in 2 dargestellt, ein Wahrnehmungssystem 74, ein Positioniersystem 76, ein Wegplanungssystem 78 und ein Fahrzeugsteuerungssystem 80 beinhalten. Wie ersichtlich ist, können die Anweisungen in verschiedenen Ausführungsformen in beliebig viele Systeme (z. B. kombiniert, weiter unterteilt, usw.) gegliedert werden, da die Offenbarung nicht auf die vorliegenden Beispiele beschränkt ist.
  • In verschiedenen Ausführungsformen synthetisiert und verarbeitet das Wahrnehmungssystem 74 die erfassten Sensordaten und prognostiziert Anwesenheit, Standort, Klassifizierung und/oder Verlauf von Objekten und Merkmalen der Umgebung des Fahrzeugs 100. In verschiedenen Ausführungsformen kann das Wahrnehmungssystem 74 Informationen von mehreren Sensoren (z. B. dem Sensorsystem 28) beinhalten, einschließlich, aber nicht beschränkt auf Kameras, Lidars, Radars und/oder eine beliebige Anzahl anderer Arten von Sensoren.
  • Das Positioniersystem 76 verarbeitet Sensordaten zusammen mit anderen Daten, um eine Position (z. B. eine lokale Position in Bezug auf eine Karte, eine exakte Position in Bezug auf die Fahrspur einer Straße, Fahrzeugrichtung, usw.) des Fahrzeugs 100 in Bezug auf die Umgebung zu bestimmen. Wie zu erkennen ist, können verschiedene Techniken eingesetzt werden, um diese Lokalisierung durchzuführen, beispielsweise simultane Lokalisierung und Kartierung (SLAM), Partikelfilter, Kalman-Filter, Bayes'sche Filter und dergleichen.
  • Das Wegplanungssystem 78 verarbeitet Sensordaten zusammen mit anderen Daten, um einen Weg zu bestimmen, dem das Fahrzeug 100 folgen soll. Das Fahrzeugsteuerungssystem 80 erzeugt Steuersignale zum Steuern des Fahrzeugs 100 entsprechend der ermittelten Strecke.
  • 3 ist ein Blockdiagramm, das ein exemplarisches Kreuzungsmanövermodul 302 (z. B. das Kreuzungsmanövermodul 102 von 1) in einem exemplarischen Fahrzeug 300 abbildet. Das Fahrzeug 300 kann ein autonomes Fahrzeug oder ein halbautonomes Fahrzeug sein. Das exemplarische Kreuzungsmanövermodul 302 ist konfiguriert, um den Entscheidungsprozess für das Fahrzeug an einer Kreuzung als Markov-Entscheidungsprozess (MDP) zu modellieren und eine empfohlene übergeordnete und untergeordnete Aktion (z. B. Beschleunigung oder Verzögerung) bereitzustellen, um die empfohlene übergeordnete Aktion durchzuführen. Das Manöver kann eines von einem Durchfahren der Kreuzung geradeaus, einem Linksabbiegen an der Kreuzung oder einem Rechtsabbiegen an der Kreuzung sein. Das exemplarische Kreuzungsmanövermodul 302 umfasst einen oder mehrere Prozessoren, die durch Programmieranweisungen konfiguriert und auf nicht-transienten, computerlesbaren Medien kodiert sind. Das exemplarische Kreuzungsmanövermodul 302 beinhaltet ein Sensordatenprozessormodul 304, ein Zustandsvektorgeneratormodul 306 und ein Sollbeschleunigungsgeneratormodul 308.
  • Das exemplarische Sensordatenverarbeitungsmodul 304 ist konfiguriert, um Sensordaten (z. B. Lidar und/oder Radar) zu verarbeiten, um gefilterte Entfernungs- und Geschwindigkeitsmessungen (z. B. 61), 180 Grad (pi Radien) vor dem Fahrzeug 300, zwischen dem Fahrzeug 300 und potenziellen Hindernissen zu erhalten. Die gefilterten Entfernungs- und Geschwindigkeitsmessungen werden anschließend an das Zustandsvektorerzeugungsmodul 306 übergeben. Die Hindernisse können bewegliche Objekte beinhalten, wie beispielsweise ein anderes Fahrzeug oder einen Fußgänger. Die Hindernisse können auch stationäre Objekte oder Fahrbahnbegrenzungen beinhalten. Unter Verwendung von Fahrzeugsensordaten (z. B. Lidar und/oder Radar) und Straßengeometriedaten (z. B. Kartendaten) ist das exemplarische Sensordatenprozessormodul 304 konfiguriert, um eine Vielzahl von Entfernungsmessungen zu erzeugen, worin jede Entfernungsmessung aus einem einzigartigen Strahl bestimmt wird, der sich von einem gemeinsamen Ausgangspunkt auf dem Fahrzeug zu einem Endpunkt erstreckt, der durch ein oder mehrere Hindernisse (z. B. ein anderes Fahrzeug, eine Fahrbahnbegrenzung, usw.) auf dem Weg dieses Strahls oder einer vorgegebenen maximalen Entfernung beendet wird. Jeder Strahl projiziert vom gemeinsamen Ausgangspunkt aus in einem einzigartigen Winkel. Unter Verwendung von Fahrzeugsensordaten 303 (z. B. Lidar und/oder Radar) ist das exemplarische Sensordatenverarbeitungsmodul 304 ferner konfiguriert, um Hindernisgeschwindigkeitsdaten zu bestimmen, worin die Hindernisgeschwindigkeitsdaten die Geschwindigkeit von Hindernissen an den Endpunkten der Strahlen umfassen.
  • Ein exemplarisches Betriebsszenario, das für das Verständnis der Strahlverfolgung nützlich sein kann, ist in 4 abgebildet. Um eine Vielzahl von Entfernungsmessungen zu bestimmen und Hindernisgeschwindigkeitsdaten zu bestimmen, ist das exemplarische Sensordatenverarbeitungsmodul 304 konfiguriert, um ein computergeneriertes virtuelles Raster 402 um das autonome Fahrzeug 404 herum aufzubauen. In diesem Beispiel ist das virtuelle Raster 402 ein quadratisches Raster und weist eine Größe von 100 Metern x 100 Metern auf. Das Zentrum 405 des exemplarischen virtuellen Rasters 402 befindet sich an der Mittelfront des autonomen Fahrzeugs 404. Das virtuelle Raster 402 ist in eine große Anzahl (z. B. eine Million) von Teilraster 406 (z. B. mit einer Größe von 0,1 Metern x 0,1 Metern) unterteilt.
  • Das exemplarische Sensordatenprozessormodul 304 ist konfiguriert, um ein Teilraster 406 mit einer belegten Eigenschaft zuzuordnen, wenn sich ein Hindernis oder ein sich bewegendes Objekt in dem durch das Teilraster 406 dargestellten physikalischen Bereich befindet. Das exemplarische Sensordatenprozessormodul 304 ist konfiguriert, um durch das virtuelle Raster 402 eine Vielzahl von linearen Strahlen 408 (z. B. 61 Strahlenspuren) zu verfolgen, die von der vorderen Mitte des AV 404 unter einer Vielzahl von einzigartigen Winkeln (z. B. welche die Vorderseite des Fahrzeugs 404 abdeckt, abgestrahlt werden, worin jeder Strahl 408 an der Vorderseite des Fahrzeugs 404 beginnt und endet, wenn er ein besetztes Teilraster erreicht, das ein Hindernis (z. B. ein sich bewegendes Fahrzeug 410, Straßenbegrenzung 412, 414, 416) oder eine vorbestimmte Entfernung (z. B. 50 Meter) anzeigt. Das exemplarische Sensordatenprozessormodul 304 ist ferner konfiguriert, um für jeden Strahl 408 den Abstand dieses Strahls 408 und die Geschwindigkeit eines Hindernisses (z. B.. fahrendes Fahrzeug 410, Straßenbegrenzung 412, 414, 416) am Endpunkt dieses Strahls 408 zu bestimmen.
  • Das exemplarische Zustandsvektor-Erzeugungsmodul 306 ist konfiguriert, um Fahrzeugzustandsdaten zu bestimmen, worin die Fahrzeugzustandsdaten eine Geschwindigkeit (v) des Fahrzeugs 404 beinhalten, eine Entfernung (dlb) zwischen dem AV 404 und einer Stopplinie 418, eine Entfernung (dmp) zwischen dem AV 404 und einem Mittelpunkt 420 einer Kreuzung und eine Entfernung (dTor) zwischen dem AV 404 und einer Zielposition 422. Das exemplarische Zustandsvektor-Erzeugungsmodul 306 ist konfiguriert, um die Fahrzeugzustandsdaten unter Verwendung von Fahrzeugsensordaten 303 (z. B. Lidar und/oder Radar) und Straßengeometriedaten (z. B. Kartendaten) zu bestimmen. Das exemplarische Zustandsvektor-Erzeugungsmodul 306 ist konfiguriert, um einen Zustandsvektor (st) (z. B. einen 126-D-Zustandsvektor) zu einem aktuellen Zeitschritt zu erzeugen, worin st = [v, dlb, dmp, dZiel, li, ci] ist, in dem i ε [0, 60] und li und ci jeweils die Länge li und die Geschwindigkeit ci am Endpunkt für jede Strahlenkurve im aktuellen Zeitschritt ist.
  • In einem exemplarischen Betriebsszenario wird zu jedem Zeitschritt ein virtuelles Raster 402 der Größe 100 m x 100 m aufgebaut, dessen Mittelpunkt die Mittelfront des AV 404 ist. Das virtuelle Raster 402 ist in eine Million Teilraster 406 mit einer Größe von 0,1 m X 0,1 m unterteilt. Jedes Teilraster 406 ist belegt, wenn sich in diesem Bereich ein Hindernis oder ein sich bewegendes Objekt befindet. Es gibt 61 Strahlenspuren 408, die von der Mittelfront des AV 404 erzeugt werden und Pi-Radien (180 Grad) umspannen, welche die Vorderansicht des AV 404 abdecken. Jeder Strahl 408 weist eine Auflösung von 0,5 Meter auf und weist eine maximale Reichweite von 50 Metern auf. Jeder Strahl 408 wird von der vorderen Mitte des AV 404 emittiert und wenn er an ein Hindernis wie die Straßenbegrenzung 412 oder ein fahrendes Fahrzeug 410 stößt, wird die entsprechende Entfernung li und Geschwindigkeit ci am Endpunkt erfasst.
  • Das exemplarische Zielbeschleunigungserzeugungsmodul 308 ist konfiguriert, um basierend auf der Vielzahl von Reichweitenmessungen die Hindernisgeschwindigkeitsdaten und die Fahrzeugzustandsdaten, einen Satz von diskreten Verhaltensaktionen höherer Ebene (z. B. Linksabbiegung, Rechtsabbiegung, Geradeausfahrt) und eine eindeutige Trajektorien-Steuerungsaktion (z. B. Beschleunigung oder Verzögerung) zu bestimmen, die jeder diskreten Verhaltensaktion höherer Ebene zugeordnet ist. Das exemplarische Zielbeschleunigungserzeugungsmodul 308 ist konfiguriert, um den Zustandsvektor (st) zu verwenden, um einen Satz von diskreten Verhaltensaktionen höherer Ebene und eine eindeutige Trajektorien-Steuerungsaktion zu bestimmen, die jeder diskreten Verhaltensaktion höherer Ebene zugeordnet ist. Das exemplarische Zielbeschleunigungserzeugungsmodul 308 umfasst ein künstliches neuronales Netzwerk (ANN) 310, das konfiguriert ist, um einen Satz von diskreten Verhaltensaktionen höherer Ebene und eine eindeutige Trajektorien-Steuerungsaktion zu berechnen, die jeder diskreten Verhaltensaktion höherer Ebene zugeordnet ist, und konfiguriert ist, um einen Satz von diskreten Verhaltensaktionen höherer Ebene und eine eindeutige Trajektorien-Steuerungsaktion zu bestimmen, die jeder diskreten Verhaltensaktion höherer Ebene zugeordnet ist, indem der Zustandsvektor (st) als Eingabe in das ANN 310 angewendet wird. Es sind zwei Instanzen des ANN 310 abgebildet, eine (310(t)) zu einem aktuellen Zeitschritt t und eine zweite (310(t-1)) zu einem früheren Zeitschritt t-1.
  • Das exemplarische ANN 310 umfasst ein hierarchisches Optionsnetzwerk 311, das konfiguriert ist, um zwei hierarchische Optionskandidaten zu erzeugen, die einen Vertrauensoptionskandidaten und einen Nicht-Vertrauensoptionskandidaten umfassen. Das exemplarische ANN 310 umfasst ferner ein Low-Level-Aktionsnetzwerk 321, das konfiguriert ist, um kontinuierliche Aktionsauswahlen für Beschleunigung und Verzögerung auf niedrigerer Ebene zu erzeugen, und ein Q-Wertnetzwerk 331, das konfiguriert ist, um Q-Werte zu erzeugen, die den kontinuierlichen Aktionsauswahlen für Beschleunigung und Verzögerung auf niedrigerer Ebene entsprechen.
  • Im exemplarischen hierarchischen Optionsnetzwerk 311 wird ein Eingangszustandsvektor st (312) verwendet, gefolgt von drei vollständig verbundenen (FC) Schichten 314, um eine Q-Wert-Matrix Ot (316) zu erzeugen, die zwei hierarchischen Optionskandidaten (318) entspricht (z. B. gehen oder nicht gehen). In dem exemplarischen Low-Level-Aktionsnetzwerk 321, dem Eingangszustandsvektor st (312) folgen vier FC-Schichten (320), um einen kontinuierlichen Aktionsvektor at (322) zu erzeugen (z. B. ein kontinuierlicher 2D-Aktionsvektor mit Beschleunigungs- oder Verzögerungsratendaten). Das exemplarische Q-Werte-Netzwerk 331 empfängt die Ausgabe einer Verkettung 333 des Eingangszustandsvektors st (312) gefolgt von einer FC-Schicht 324 mit dem kontinuierlichen Aktionsvektor at (322), gefolgt von einer FC-Schicht 326, und ist konfiguriert, um über vier FC-Schichten 328 einen Q-Wertevektor Qt zu (330) zu erzeugen, die dem Aktionsvektor 332 entspricht.
  • Das exemplarische ANN 310 kann mit Verstärkungslernalgorithmen wie den nachfolgend dargestellten Algorithmen trainiert werden:
    Figure DE102019114867A1_0001
    Figure DE102019114867A1_0002
  • Das exemplarische Zielbeschleunigungs-Erzeugungsmodul 308 ist ferner konfiguriert, um eine übergeordnete diskrete Verhaltensaktion und eine einzigartige Trajektorien-Steuerungsaktion zu wählen, die an einer Kreuzung durchgeführt wird, und um die Wahl durch Modellieren des Prozesses der Aktionswahl als Markov-Entscheidungsprozess (MDP) zu treffen. Das exemplarische Zielbeschleunigungs-Erzeugungsmodul 308 ist konfiguriert, um unter Verwendung der hierarchischen Optionskandidaten zu entscheiden, dass das AV-Fahrzeug der Umgebung vertrauen kann und sich entscheidet, die einzigartige Trajektorien-Steuerungsaktion (z. B. Beschleunigung oder Verzögerung) des ANN 310 zu implementieren. Das exemplarische Zielbeschleunigungs-Erzeugungsmodul 308 ist konfiguriert, um eine optimale Richtlinie über das ANN 310 unter Verwendung von Verstärkungslernen zu lernen, und konfiguriert, um die optimale Richtlinie zu implementieren, um ein Manöver an der Kreuzung abzuschließen. Um die optimale Richtlinie zur Vervollständigung eines Manövers an der Kreuzung zu implementieren, ist das exemplarische Kreuzungsmanövermodul 302 ferner konfiguriert, um eine Nachricht 309 an Fahrzeugsteuerungen zu übermitteln, welche die eindeutige Trajektorien-Steuerungsaktion übermittelt, die der diskreten Verhaltensaktion der höheren Ebene zugeordnet ist.
  • Ein exemplarisches Kreuzungsmanövermodul 302 kann eine beliebige Anzahl zusätzlicher, in die Steuerung 34 eingebetteter Teilmodule beinhalten, die mit den hierin beschriebenen Systemen und Verfahren kombiniert und/oder weiter untergliedert werden können. Zusätzlich können Eingaben in das Kreuzungsmanövermodul 302 vom Sensorsystem 28 empfangen werden, die von anderen Steuermodulen (nicht dargestellt) empfangen werden, die dem Fahrzeug 100 zugeordnet sind, die vom Kommunikationssystem 36 empfangen werden und/oder von anderen Teilmodulen (nicht dargestellt), die innerhalb der Steuerung 34 von 1 ermittelt/modelliert werden. Weiterhin können die Eingaben auch einer Vorverarbeitung unterzogen werden, wie beispielsweise Teilabtastung, Rauschunterdrückung, Normalisierung, Merkmalsextraktion, fehlende Datenreduktion und dergleichen.
  • Die verschiedenen vorstehend beschriebenen Module können als ein oder mehrere maschinelle Lernmodelle implementiert werden, die einem überwachten, unbeaufsichtigten, teilüberwachten oder verstärkten Lernen unterzogen werden und Klassifizierungen (z. B. binäre oder mehrstufige Klassifizierungen), Regression, Clustering, Dimensionalitätsreduktion und/oder solche Aufgaben durchführen. Beispiele für diese Modelle sind künstliche neuronale Netze (ANN) (z. B. rekurrierende neuronale Netze (RNN) und faltungsneuronale Netze (CNN)), Entscheidungsbaummodelle (z. B. Klassifikations- und Regressionsbäume (CART)), Ensemble-Lernmodelle (z. B. Boosting, Bootstrapped Aggregation, Gradienten-Boost-Maschinen und Random Forest), Bayes'sche Netzwerkmodelle (z. B. naive Bayes), Hauptkomponentenanalyse (PCA), Unterstützungsvektormaschinen (SVM), Clustering-Modelle (wie K-Neighbor, K-Mittel, Erwartungsmaximierung, hierarchisches Clustering usw.), lineare Diskriminanzanalysemodelle.
  • In einigen Ausführungsformen erfolgt das Lernen aller vom Kreuzungsmanövermodul 302 verwendeten maschinellen Lernmodelle innerhalb eines vom Fahrzeug 300 entfernten Systems, das anschließend zum Fahrzeug 300 heruntergeladen und während des normalen Betriebs des Fahrzeugs 300 verwendet wird. In weiteren Ausführungsformen erfolgt das Lernen zumindest teilweise innerhalb der Steuerung 34 des Fahrzeugs 300 selbst, und das Modell wird anschließend mit externen Systemen und/oder anderen Fahrzeugen einer Flotte geteilt. Trainingsdaten können in ähnlicher Weise vom Fahrzeug 300 erzeugt oder extern erfasst und vor dem Anlernen in Trainings-, Validierungs- und Testsätze aufgeteilt werden.
  • 5 ist ein Prozessablaufdiagramm, das einen exemplarischen Prozess 500 in einem Fahrzeug zum Auswählen von Fahrzeugaktionen an einer Kreuzung abbildet. Die Abfolge der Vorgänge innerhalb des exemplarischen Prozesses 500 ist nicht auf die in der Figur dargestellte sequenzielle Abarbeitung beschränkt, sondern kann in einer oder mehreren unterschiedlichen Reihenfolgen gemäß der vorliegenden Offenbarung durchgeführt werden.
  • Der exemplarische Prozess 500 beinhaltet das Bestimmen einer Vielzahl von Entfernungsmessungen und der Geschwindigkeit von Hindernissen am Endpunkt der Entfernungsmessungen aus Fahrzeugsensordaten und Straßengeometriedaten (Vorgang 502). Jede Entfernungsmessung wird aus einem eindeutigen Strahl bestimmt, der sich in einem eindeutigen Winkel von einem gemeinsamen Startpunkt am Fahrzeug zu einem Endpunkt erstreckt, der durch ein oder mehrere Hindernisse (z. B. ein anderes Fahrzeug, eine Fahrbahnbegrenzung usw.) im Weg dieses Strahls oder eine vorbestimmte maximale Entfernung abgeschlossen wird.
  • Der exemplarische Prozess 500 beinhaltet ferner das Bestimmen von Fahrzeugzustandsdaten (Vorgang 504). Die Fahrzeugzustandsdaten beinhalten eine Geschwindigkeit des Fahrzeugs, eine Entfernung zu einer Stopplinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel.
  • Der exemplarische Prozess 500 beinhaltet ferner das Bestimmen eines Satzes von diskreten Verhaltensaktionen höherer Ebene (z. B. Linksabbiegen, Rechtsabbiegen, Geradeausfahren) und einer eindeutigen Trajektorien-Steuerungsaktion (z. B. Beschleunigungs- oder Verzögerungsebene), die jeder diskreten Verhaltensaktion höherer Ebene zugeordnet ist (Vorgang 506). Das Bestimmen erfolgt unter Verwendung der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten. Das Bestimmen kann unter Verwendung eines Zustandsvektors (z. B. 126-D-Zustandsvektors) durchgeführt werden, der die Fahrzeugzustandsdaten (z. B. die Geschwindigkeit des Fahrzeugs, eine Entfernung zu einer Stopplinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel), die Entfernung jedes Strahls und die Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls beinhaltet. Das Bestimmen kann durch Anwenden des Zustandsvektors als Eingabe in ein neuronales Netzwerk durchgeführt werden, das konfiguriert ist, um einen Satz von diskreten Verhaltensaktionen höherer Ebene und eine eindeutige Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion höherer Ebene zugeordnet ist, zu berechnen.
  • Das neuronale Netzwerk kann ein hierarchisches Optionsnetzwerk beinhalten, das konfiguriert ist, um zwei hierarchische Optionskandidaten zu erzeugen, worin die hierarchischen Optionskandidaten einen Vertrauensoptionskandidaten und einen nicht vertrauenswürdigen Optionskandidaten beinhalten; ein Low-Level-Aktionsnetzwerk, das konfiguriert ist, um Auswahlmöglichkeiten für kontinuierliche Aktionen auf niedrigerer Ebene zum Beschleunigen und Verzögern zu erzeugen; und ein Q-Wertnetzwerk, das konfiguriert ist, um Q-Werte zu erzeugen, die den Auswahlmöglichkeiten für kontinuierliche Aktionen auf niedrigerer Ebene zum Beschleunigen und Verzögern entsprechen. Das neuronale Netzwerk kann ein hierarchisches Optionsnetzwerk beinhalten, worin ein Eingangszustandsvektor st (z. B. ein 126-D Eingangszustandsvektor) gefolgt von drei vollständig verbundenen (FC)-Schichten, um eine Q-Wert-Matrix Ot zu erzeugen (z. B. eine 2-D Q-Werte-Matrix), die zwei hierarchischen Optionskandidaten (z. B. gehen oder nicht gehen) entspricht; ein Low-Level-Aktionsnetzwerk, worin dem Eingangszustandsvektor st vier FC-Schichten folgen, um einen kontinuierlichen Aktionsvektor at (z. B. einen 2-D kontinuierlichen Aktionsvektor mit Daten zur Beschleunigung oder Verzögerung) zu erzeugen; und ein Q-Wertnetzwerk, das die Ausgabe einer Verkettung des Eingangszustandsvektors empfängt, gefolgt von einer FC-Schicht mit dem kontinuierlichen Aktionsvektor at gefolgt von einer FC-Schicht, worin das Q-Wertnetzwerk konfiguriert ist, um durch vier FC-Schichten einen Q-Wertevektor Qt zu erzeugen, der dem Aktionsvektor entspricht.
  • Der exemplarische Prozess 500 beinhaltet ferner die Auswahl einer übergeordneten diskreten Verhaltensaktion und einer eindeutigen Trajektorien-Steuerungsaktion (Vorgang 508). Die Auswahl kann durchgeführt werden, indem der Prozess des Auswählens eines Manövers, das an einer Kreuzung versucht werden soll, als Markov-Entscheidungsprozess (MDP) modelliert wird, eine optimale Richtlinie über das neuronale Netzwerk unter Verwendung von Verstärkungslernen erlernt und die optimale Richtlinie implementiert wird, um das Manöver an der Kreuzung abzuschließen.
  • Der exemplarische Prozess 500 beinhaltet ferner das Übermitteln einer Nachricht an Fahrzeugsteuerungen, welche die eindeutige Trajektorien-Steuerungsaktion vermittelt, die der übergeordneten diskreten Verhaltensaktion (Vorgang 510) zugeordnet ist. Fahrzeugsteuerungen können die übermittelte Trajektorien-Steuerungsaktion implementieren, um ein Manöver an einer Kreuzung durchzuführen.
  • 6 ist ein Prozessablaufdiagramm, das einen exemplarischen Prozess 600 zur Strahlverfolgung beim Bestimmen von Entfernungsmessungen und der Geschwindigkeit von Hindernissen am Endpunkt der für Entfernungsmessungen verwendeten Strahlen abbildet. Die Abfolge der Vorgänge innerhalb des beispielhaften Prozesses 600 ist nicht auf die in der Figur dargestellte sequenzielle Abarbeitung beschränkt, sondern kann, soweit anwendbar, in einer oder mehreren unterschiedlichen Reihenfolgen wie erforderlich und gemäß der vorliegenden Offenbarung, durchgeführt werden.
  • Der exemplarische Prozess 600 beinhaltet das Konstruieren eines computergenerierten virtuellen Rasters (z. B. ein quadratisches Rasters) um das autonome Fahrzeug (z. B. Größe 100 Meter mal 100 Meter) herum, wobei sich die Mitte des virtuellen Rasters an der Mittelfront des autonomen Fahrzeugs (Vorgang 602) befindet. Der exemplarische Prozess 600 beinhaltet die Unterteilung des virtuellen Rasters in eine große Anzahl (z. B. eine Million) von Teilraster (z. B. mit einer Größe von 0,1 Metern x 0,1 Metern) (Vorgang 604). Der exemplarische Prozess 600 beinhaltet die Zuordnung eines belegten Merkmals zu einem Teilraster, wenn sich ein Hindernis oder ein sich bewegendes Objekt in dem durch das Teilraster dargestellten Bereich befindet (Vorgang 606).
  • Der exemplarische Prozess 600 beinhaltet ferner das Verfolgen einer Vielzahl von linearen Strahlen durch das virtuelle Raster (Vorgang 608). Die Vielzahl von linearen Strahlen (z. B. 61 Strahlenspuren) werden im exemplarischen Prozess von der vorderen Mitte des AV in einer Vielzahl von eindeutigen Winkeln (z. B. welche die Vorderseite des Fahrzeugs abdeckt, abgestrahlt werden, worin jeder Strahl an der mittleren Vorderseite des autonomen Fahrzeugs beginnt und endet, wenn er ein belegtes Teilraster erreicht, das ein Hindernis (z. B. ein sich bewegendes Fahrzeug, Straßenbegrenzung) oder eine vorbestimmte Entfernung (z. B. 50 Meter) anzeigt. Die Strahlverfolgung beinhaltet das Bestimmen der Entfernung dieses Strahls und der Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls für jeden Strahl.
  • Während mindestens eine exemplarische Ausführungsform in der vorstehenden ausführlichen Beschreibung dargestellt wurde, versteht es sich, dass es eine große Anzahl an Varianten gibt. Es versteht sich weiterhin, dass die exemplarische Ausführungsform oder die exemplarischen Ausführungsformen lediglich Beispiele sind und den Umfang, die Anwendbarkeit oder die Konfiguration dieser Offenbarung in keiner Weise einschränken sollen. Die vorstehende ausführliche Beschreibung stellt Fachleuten auf dem Gebiet vielmehr einen zweckmäßigen Plan zur Implementierung der exemplarischen Ausführungsform bzw. der exemplarischen Ausführungsformen zur Verfügung. Verschiedene Änderungen an der Funktion und der Anordnung von Elementen können vorgenommen werden, ohne vom Umfang der Offenbarung, wie er in den beigefügten Ansprüchen und deren rechtlichen Entsprechungen aufgeführt wird, abzuweichen.

Claims (10)

  1. Prozessorimplementiertes Verfahren in einem autonomen Fahrzeug (AV) zum Ausführen eines Manövers an einer Kreuzung, das Verfahren umfassend: Bestimmen einer Vielzahl von Entfernungsmessungen durch einen Prozessor aus Fahrzeugsensordaten und Straßengeometriedaten, wobei jede Entfernungsmessung von einem einzigartigen Strahl bestimmt wird, der sich von einem Startpunkt auf dem AV bis zu einem Endpunkt erstreckt, der durch ein Hindernis im Weg dieses Strahls oder eine vorgegebene maximale Entfernung beendet wird; Bestimmen von Hindernisgeschwindigkeitsdaten durch den Prozessor aus Fahrzeugsensordaten, worin die Hindernisgeschwindigkeitsdaten eine Geschwindigkeit eines Hindernisses umfassen, das als sich am Endpunkt der Strahlen befindlich bestimmt wurde; Bestimmen der Fahrzeugzustandsdaten durch den Prozessor, wobei die Fahrzeugzustandsdaten eine Geschwindigkeit des AV, eine Entfernung zu einer Haltelinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel beinhalten; Bestimmen, durch den Prozessor basierend auf der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten, eines Satzes von diskreten Verhaltensaktionen und einer eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist; Auswählen einer diskreten Verhaltensaktion durch den Prozessor aus dem Satz von diskreten Verhaltensaktionen und der zugehörigen eindeutigen Trajektorien-Steuerungsaktion zum Ausführen; und Übermitteln einer Nachricht an Fahrzeugsteuerungen durch den Prozessor, welche die gewählte eindeutige Trajektorien-Steuerungsaktion, die mit der diskreten Verhaltensaktion verbunden ist, übermittelt.
  2. Verfahren nach Anspruch 1, worin das Bestimmen einer Vielzahl von Entfernungsmessungen und das Bestimmen von Hindernisgeschwindigkeitsdaten umfasst: Konstruieren eines computergenerierten virtuellen Rasters um das AV herum, wobei die Mitte des virtuellen Rasters an einer Mittelfront des AV angeordnet ist; Unterteilen des virtuellen Rasters in eine Vielzahl von Teilraster; Zuordnen eines belegten Merkmals zu einem Teilraster, wenn sich ein Hindernis oder ein sich bewegendes Objekt in dem durch das Teilraster dargestellten Bereich befindet; Verfolgen einer Vielzahl von linearen Strahlen, die von der Mittelfront des AV in einer Vielzahl von eindeutigen Winkeln ausgestrahlt werden, die eine Vorderseite des AV abdecken, durch das virtuelle Raster, worin jeder Strahl an der Mittelfront des AV beginnt und endet, wenn er ein belegtes Teilraster erreicht, das ein Hindernis oder eine vorbestimmte Entfernung anzeigt; und Bestimmen der Entfernung dieses Strahls und der Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls für jeden Strahl.
  3. Verfahren nach Anspruch 1, worin das Bestimmen des Satzes von diskreten Verhaltens -Aktionen und die eindeutige Trajektorien-Steuerungsaktion, die jeder einzelnen diskreten Verhaltensaktion zugeordnet ist, umfasst: Erzeugen eines Zustandsvektors, der die Fahrzeugzustandsdaten, die Entfernung eines jeden Strahls und die Geschwindigkeit von Hindernissen an den Endpunkten der Strahlen beinhaltet.
  4. Verfahren nach Anspruch 3, worin das Bestimmen des Satzes von diskreten Verhaltens -Aktionen und der eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist, ferner umfasst: Anwenden des Zustandsvektors als Eingabe in ein neuronales Netzwerk, das konfiguriert ist, um einen Satz von diskreten Verhaltensaktionen und die eindeutige Trajektorien-Steuerungsaktion zu berechnen, die jeder diskreten Verhaltensaktion zugeordnet ist.
  5. Verfahren nach Anspruch 4, worin das neuronale Netzwerk Folgendes umfasst: ein hierarchisches Optionen -Netzwerk , das konfiguriert ist, um zwei hierarchische Optionskandidaten zu erzeugen, wobei die beiden hierarchischen Optionskandidaten jeweils einen Vertrauensoptionskandidaten und einen Nicht-Vertrauensoptionskandidaten beinhalten; ein Aktionsnetzwerk, das konfiguriert ist, um Auswahlmöglichkeiten für kontinuierliche Aktionen auf niedrigerer Ebene zur Beschleunigung und Verzögerung zu erzeugen; und ein Q-Wertnetzwerk, das konfiguriert ist, um Q-Werte zu erzeugen, die den Auswahlmöglichkeiten für kontinuierliche Aktionen auf niedrigerer Ebene zur Beschleunigung und Verzögerung entsprechen.
  6. Verfahren nach Anspruch 4, worin das neuronale Netzwerk Folgendes umfasst: ein hierarchisches Optionen -Netzwerk , worin auf einen Eingangszustandsvektor st drei vollständig verbundene (FC)-Schichten folgen, um eine Q-Wert-Matrix Ot zu erzeugen, die zwei hierarchischen Optionskandidaten entspricht; ein Aktionsnetzwerk, worin dem Eingangszustandsvektor st vier FC-Schichten folgen, um einen kontinuierlichen Aktionsvektor at zu erzeugen; und ein Q-Wert-Netzwerk, das die Ausgabe einer Verkettung des Eingangszustandsvektors st empfängt, gefolgt von einer FC-Schicht mit dem kontinuierlichen Aktionsvektor at gefolgt von einer FC-Schicht, worin das Q-Wert-Netzwerk konfiguriert ist, um durch vier FC-Schichten einen Q-Wertvektor Qt zu erzeugen, der dem Aktionsvektor at entspricht.
  7. Verfahren nach Anspruch 6, worin das Auswählen einer diskreten Verhaltens -Aktion und einer eindeutigen Trajektorien-Steuerungsaktion zum Ausführen von Folgendem umfasst: Modellieren einer Auswahl von Aktionen als Markov-Entscheidungsprozess (MDP); Lernen einer optimalen Richtlinie über das neuronale Netzwerk unter Verwendung von Verstärkungslernen; und Implementieren der optimalen Richtlinie, um das Manöver an der Kreuzung abzuschließen.
  8. Autonomes Fahrzeug (AV), umfassend: eine oder mehrere Sensorvorrichtungen, die konfiguriert sind, um Fahrzeugsensordaten zu erzeugen; und ein Kreuzungsmanövermodul, das konfiguriert ist zum: Bestimmen einer Vielzahl von Entfernungsmessungen aus Fahrzeugsensordaten und Straßengeometriedaten, wobei jede Entfernungsmessung von einem einzigartigen Strahl bestimmt wird, der sich von einem Startpunkt auf dem AV bis zu einem Endpunkt erstreckt, der durch ein Hindernis im Weg dieses Strahls oder eine vorgegebene maximale Entfernung beendet wird; Bestimmen von Hindernisgeschwindigkeitsdaten aus Fahrzeugsensordaten, worin die Hindernisgeschwindigkeitsdaten eine Geschwindigkeit eines Hindernisses umfassen, das als sich am Endpunkt der Strahlen befindlich bestimmt wurde; Bestimmen von Fahrzeugzustandsdaten, worin die Fahrzeugzustandsdaten eine Geschwindigkeit des AV, eine Entfernung zu einer Haltelinie, eine Entfernung zu einem Mittelpunkt einer Kreuzung und eine Entfernung zu einem Ziel beinhalten; Bestimmen, basierend auf der Vielzahl von Entfernungsmessungen, der Hindernisgeschwindigkeitsdaten und der Fahrzeugzustandsdaten, eines Satzes von diskreten Verhaltensaktionen und einer eindeutigen Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist; Auswählen einer diskreten Verhaltensaktion aus dem Satz von diskreten Verhaltensaktionen und der zugehörigen eindeutigen Trajektorien-Steuerungsaktion zum Ausführen; und Übermitteln einer Nachricht an Fahrzeugsteuerungen, welche die gewählte eindeutige Trajektorien-Steuerungsaktion, die mit der diskreten Verhaltensaktion verbunden ist, übermittelt.
  9. Autonomes Fahrzeug nach Anspruch 8, worin das Kreuzungsmanövermodul konfiguriert ist, um eine Vielzahl von Entfernungsmessungen zu bestimmen und Hindernis - Geschwindigkeitsdaten zu bestimmen durch: Konstruieren eines computergenerierten virtuellen Rasters um das AV herum, wobei die Mitte des virtuellen Rasters an einer Mittelfront des AV angeordnet ist; Unterteilen des virtuellen Rasters in eine Vielzahl von Teilraster; Zuordnen eines belegten Merkmals zu einem Teilraster, wenn sich ein Hindernis oder ein sich bewegendes Objekt in dem durch das Teilraster dargestellten Bereich befindet; Verfolgen einer Vielzahl von linearen Strahlen, die von der Mittelfront des AV in einer Vielzahl von eindeutigen Winkeln ausgestrahlt werden, die eine Vorderseite des AV abdecken, durch das virtuelle Raster, worin jeder Strahl an der Mittelfront des AV beginnt und endet, wenn er ein belegtes Teilraster erreicht, das ein Hindernis oder eine vorbestimmte Entfernung anzeigt; und Bestimmen der Entfernung dieses Strahls und der Geschwindigkeit eines Hindernisses am Endpunkt dieses Strahls für jeden Strahl.
  10. Autonomes Fahrzeug nach Anspruch 9, worin: das Kreuzungsmanövermodul konfiguriert ist, um einen Satz von diskreten Verhaltensaktionen und eine eindeutige Trajektorien-Steuerungsaktion zu bestimmen, mit jeder diskreten Verhaltensaktion durch: Erzeugen eines Zustandsvektors, der die Fahrzeugzustandsdaten, den Abstand jedes Strahls und die Geschwindigkeit von Hindernissen an den Endpunkten der Strahlen beinhaltet; und Anwenden des Zustandsvektors als Eingabe in ein neuronales Netzwerk, das konfiguriert ist, um den Satz von diskreten Verhaltensaktionen und die eindeutige Trajektorien-Steuerungsaktion, die jeder diskreten Verhaltensaktion zugeordnet ist, zu berechnen; und das neuronale Netzwerk, das Folgendes umfasst: ein hierarchisches Optionennetzwerk, worin auf einen Eingangszustandsvektor st drei vollständig verbundene (FC)-Schichten folgen, um eine Q-Wert-Matrix Ot zu erzeugen, die zwei hierarchischen Optionskandidaten entspricht; ein Aktionsnetzwerk, worin dem Eingangszustandsvektor st vier FC-Schichten folgen, um einen kontinuierlichen Aktionsvektor at zu erzeugen; und ein Q-Wert-Netzwerk, das die Ausgabe einer Verkettung des Eingangszustandsvektors st empfängt, gefolgt von einer FC-Schicht mit dem kontinuierlichen Aktionsvektor at gefolgt von einer FC-Schicht, worin das Q-Wert-Netzwerk konfiguriert ist, um durch vier FC-Schichten einen Q-Wertvektor Qt zu erzeugen, der dem Aktionsvektor at entspricht.
DE102019114867.7A 2018-07-19 2019-06-03 Autonome fahrentscheidungen an kreuzungen unter verwendung eines hierarchischen optionalen markov-entscheidungsprozesses Withdrawn DE102019114867A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/039,579 2018-07-19
US16/039,579 US20200026277A1 (en) 2018-07-19 2018-07-19 Autonomous driving decisions at intersections using hierarchical options markov decision process

Publications (1)

Publication Number Publication Date
DE102019114867A1 true DE102019114867A1 (de) 2020-02-13

Family

ID=69161858

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102019114867.7A Withdrawn DE102019114867A1 (de) 2018-07-19 2019-06-03 Autonome fahrentscheidungen an kreuzungen unter verwendung eines hierarchischen optionalen markov-entscheidungsprozesses

Country Status (3)

Country Link
US (1) US20200026277A1 (de)
CN (1) CN110806744A (de)
DE (1) DE102019114867A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019213927A1 (de) * 2019-09-12 2021-03-18 Zf Friedrichshafen Ag Grid-basierte Leitpfosten-Klassifizierung
DE102020113338A1 (de) 2020-05-18 2021-11-18 Bayerische Motoren Werke Aktiengesellschaft Prädiktion eines Verhaltens eines Verkehrsteilnehmers

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11030364B2 (en) * 2018-09-12 2021-06-08 Ford Global Technologies, Llc Evaluating autonomous vehicle algorithms
US11131992B2 (en) * 2018-11-30 2021-09-28 Denso International America, Inc. Multi-level collaborative control system with dual neural network planning for autonomous vehicle control in a noisy environment
DE102019104974A1 (de) * 2019-02-27 2020-08-27 Zf Automotive Germany Gmbh Verfahren sowie System zum Bestimmen eines Fahrmanövers
US11167754B2 (en) 2019-08-22 2021-11-09 Argo AI, LLC Systems and methods for trajectory based safekeeping of vehicles
US11072326B2 (en) 2019-08-22 2021-07-27 Argo AI, LLC Systems and methods for trajectory based safekeeping of vehicles
CN111695201B (zh) * 2020-06-11 2023-06-02 中国人民解放军国防科技大学 一种基于数据的磁浮列车运行状态的监测方法
CN111845741B (zh) * 2020-06-28 2021-08-03 江苏大学 一种基于分层强化学习的自动驾驶决策控制方法及系统
US11618444B2 (en) 2020-10-01 2023-04-04 Argo AI, LLC Methods and systems for autonomous vehicle inference of routes for actors exhibiting unrecognized behavior
US11731661B2 (en) 2020-10-01 2023-08-22 Argo AI, LLC Systems and methods for imminent collision avoidance
US11358598B2 (en) 2020-10-01 2022-06-14 Argo AI, LLC Methods and systems for performing outlet inference by an autonomous vehicle to determine feasible paths through an intersection
US12103560B2 (en) 2020-10-01 2024-10-01 Argo AI, LLC Methods and systems for predicting actions of an object by an autonomous vehicle to determine feasible paths through a conflicted area
CN112329682B (zh) * 2020-11-16 2024-01-26 常州大学 一种基于穿越动作和交通场景上下文因素的行人穿越马路意图识别方法
US11749000B2 (en) 2020-12-22 2023-09-05 Waymo Llc Stop location change detection
US12128929B2 (en) * 2021-08-05 2024-10-29 Argo AI, LLC Methods and system for predicting trajectories of actors with respect to a drivable area
US11904906B2 (en) 2021-08-05 2024-02-20 Argo AI, LLC Systems and methods for prediction of a jaywalker trajectory through an intersection

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9140792B2 (en) * 2011-06-01 2015-09-22 GM Global Technology Operations LLC System and method for sensor based environmental model construction
CN103996312B (zh) * 2014-05-23 2015-12-09 北京理工大学 具有社会行为交互的无人驾驶汽车控制系统
US10401852B2 (en) * 2015-11-04 2019-09-03 Zoox, Inc. Teleoperation system and method for trajectory modification of autonomous vehicles
US11372416B2 (en) * 2017-03-01 2022-06-28 Mobileye Vision Technologies Ltd. Systems and methods for navigating with sensing uncertainty
CN107346611B (zh) * 2017-07-20 2021-03-23 北京纵目安驰智能科技有限公司 一种自主驾驶的车辆的避障方法以及避障系统
CN107784709A (zh) * 2017-09-05 2018-03-09 百度在线网络技术(北京)有限公司 处理自动驾驶训练数据的方法和装置
US20180150080A1 (en) * 2018-01-24 2018-05-31 GM Global Technology Operations LLC Systems and methods for path planning in autonomous vehicles
US11048265B2 (en) * 2018-06-18 2021-06-29 Zoox, Inc. Occlusion aware planning

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019213927A1 (de) * 2019-09-12 2021-03-18 Zf Friedrichshafen Ag Grid-basierte Leitpfosten-Klassifizierung
DE102020113338A1 (de) 2020-05-18 2021-11-18 Bayerische Motoren Werke Aktiengesellschaft Prädiktion eines Verhaltens eines Verkehrsteilnehmers

Also Published As

Publication number Publication date
CN110806744A (zh) 2020-02-18
US20200026277A1 (en) 2020-01-23

Similar Documents

Publication Publication Date Title
DE102019114867A1 (de) Autonome fahrentscheidungen an kreuzungen unter verwendung eines hierarchischen optionalen markov-entscheidungsprozesses
DE102019103352A1 (de) Trajektorienverfolgung für die fahrzeugseitensteuerung unter verwendung eines neuronalen netzwerks
DE102018129066B4 (de) Systeme und verfahren für ungeschütztes linksabbiegen in situationen mit hohem verkehrsaufkommen in autonomen fahrzeugen
DE102020103130A1 (de) System und verfahren zur radar-kreuzverkehrsverfolgung und manöver-risikoabschätzung
DE102018129295A1 (de) Systeme und Verfahren zum Abbilden von Fahrbahnstörobjekten in autonomen Fahrzeugen
DE102018133576A1 (de) Trajektorienplaner mit dynamischem kostenlernen für autonomes fahren
DE102018129074A1 (de) Systeme und verfahren zum umfahren von hindernissen in autonomen fahrzeugen
DE102018113926A1 (de) Autonome Fahrzeugantriebssysteme und Verfahren für kritische Zustände
DE102020110458A1 (de) Fahrzeugpfadvorhersage
DE102018129063A1 (de) Systeme und verfahren zur freiraum-inferenz zum brechen von geclusterten objekten in fahrzeugwahrnehmungssystemen
DE102018129064A1 (de) Systeme und verfahren zur geschwindigkeitsanpassung für einen bevorstehenden spurwechsel in autonomen fahrzeugen
DE102019100572A1 (de) Systeme und verfahren für die wegplanung in autonomen fahrzeugen
DE102018119764A1 (de) Verfahren und vorrichtung zur erkennung und korrektur von anomalien in einer partizipativen karte
DE102018115263A1 (de) Systeme und verfahren zur vorhersage von verkehrsmustern in einem autonomen fahrzeug
DE102019115080A1 (de) Verfahren zum vereindeutigen mehrdeutiger erkennungen in sensorfusionssystemen
DE102019111556A1 (de) Autonome fahrdynamische komfortsteuerung
DE102018129057A1 (de) Systeme und verfahren zum bestimmen der geschwindigkeit von lidar-punkten
DE102018123467A1 (de) Verfahren und systeme zur radar-lokalisierung in autonomen fahrzeugen
DE102018123464A1 (de) Verfahren und systeme zur radar-lokalisierung in autonomen fahrzeugen
DE102020103030A1 (de) Adaptives sensorsystem für fahrzeuge und verfahren zum betreiben desselben
DE102020102717A1 (de) Verfahren und systeme zur steuerung der seitlichen position des fahrzeugs über eine kreuzung
DE102019114374A1 (de) KOMMUNIKATION ZWISCHEN AUTONOMEM FAHRZEUG UND FUßGÄNGERN UNTER VERWENDUNG VON DIREKTIONALEM SCHALL
DE112021006111T5 (de) Systeme und Verfahren zur monokularisierten Objekterkennung
DE102018129075A1 (de) Systeme und verfahren zur visuellen positionsschätzung in autonomen fahrzeugen
DE102020127206A1 (de) Prozess und system zur gemeinsamen nutzung von sensoren für einen autonomen fahrspurwechsel

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: LKGLOBAL | LORENZ & KOPF PARTG MBB PATENTANWAE, DE

Representative=s name: LKGLOBAL ] LORENZ & KOPF PARTG MBB PATENTANWAE, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee