Detailergebnis zu DOK-Nr. 80433
Navigation von Elektrofahrzeugen entlang eines signalisierten Korridors mittels Reinforcement Learning: Auf dem Weg zur adaptiven Eco-Driving-Steuerung (Orig. engl.: Navigating electric vehicles along a signalized corridor via reinforcement learning: Toward adaptive eco-driving control)
Autoren |
J. Zhang X. Jiang S. Cui C. Yang B. Ran |
---|---|
Sachgebiete |
0.11 Daten (EDV, IT, Internetanwendungen und Verkehrsdaten) 6.2 Verkehrsberechnungen, Verkehrsmodelle 6.10 Energieverbrauch, Elektromobilität |
Transportation Research Record: Journal of the Transportation Research Board Vol. 2676, H. 8, 2022, S. 657-669, 9 B, 2 T, 43 Q. − Online-Ressource: verfügbar unter: https://journals.sagepub.com/home/trr
Ein Problem im Zusammenhang mit dem Betrieb von Elektrofahrzeugen (EVs) ist die Batterie, die keine lange Lebensdauer garantieren kann. Der steigende Stromverbrauch belastet auch die Ökonomie und Ökologie der Fahrzeuge. Um Energieeinsparungen zu erzielen, wird in dem Artikel eine adaptive Öko-Fahrmethode in der Umgebung von signalisierten Korridoren vorgeschlagen. Der Rahmen mit adaptiver Echtzeitsteuerung wird durch die Technik des verstärkten Lernens (Reinforcement Learning) implementiert. Zunächst wurde der Betrieb von E-Fahrzeugen in der Nähe von Knotenpunkten als Markov-Entscheidungsprozess (MDP) definiert, um den Algorithmus TD3 (Twin Delayed Deep Deterministic Policy Gradient) anzuwenden, der den Entscheidungsprozess mit kontinuierlichem Aktionsraum behandelt. Daher kann die Geschwindigkeit des Fahrzeugs kontinuierlich angepasst werden. Zweitens wurden Sicherheit, Verkehrsmobilität, Energieverbrauch und Komfort durch den Entwurf einer umfassenden Belohnungsfunktion für das MDP berücksichtigt. Drittens wurde in der Simulationsstudie die Aoti Street in Nanjing City (im Osten Chinas) mit mehreren aufeinanderfolgenden signalisierten Knotenpunkten als Forschungsstraßennetz verwendet, und die Zustandsdarstellung im MDP berücksichtigt die Informationen von aufeinanderfolgenden nachgeschalteten Verkehrssignalen. Nach der Parameterabstimmung wurden Simulationen für drei typische Eco-Driving-Szenarien durchgeführt, darunter freier Verkehr, Kolonnenfahren und Verkehrsstau. Durch den Vergleich mit dem Standard-Pkw-Folgeverhalten in der Simulationsplattform SUMO und verschiedenen hochmodernen Algorithmen des Deep Reinforcement Learning zeigt die vorgeschlagene Strategie eine ausgewogene und stabile Leistung.