Detailergebnis zu DOK-Nr. 81791
Verbesserte nächtliche Verkehrsdetektion durch Tag-zu-Nacht-Bildübertragung (Orig. engl.: Improved nighttime traffic detection using day-to-night image transfer)
| Autoren |
F. Guo J. Liu Q. Xie H. Chang |
|---|---|
| Sachgebiete |
0.11 Daten (EDV, IT, Internetanwendungen und Verkehrsdaten) 6.1 Verkehrserhebungen, Verkehrsmessungen |
Transportation Research Record (TRR): Journal of the Transportation Research Board Vol. 2677, H. 11, 2023, S. 711-721, 6 B, 4 T, 35 Q. - Online-Ressource: verfügbar unter: https://journals.sagepub.com/home/trr
Mit der rasanten Entwicklung von faltenden neuronalen Netzen (convolutional neural networks, CNNs) wurde die Echtzeit-Verkehrsüberwachung, die sowohl der Verkehrsoptimierung als auch dem Verkehrsmanagement zugutekommt, in großem Umfang mit intelligenten Kameras auf den Straßen eingesetzt. Die CNN sind künstliche neuronale Netze und ein von biologischen Prozessen inspiriertes Konzept im Bereich des maschinellen Lernens. Im Vergleich zur Verkehrserkennung am Tag ist die Verkehrserkennung in der Nacht durch Beschriftungen eingeschränkt und daher in der Praxis instabil, ungenau und ineffizient. Um dieses Problem zu beheben, schlägt die Studie der Shandong-Universität in Jinan (China) vor, die durch "Cycle Generative Adversarial Networks" (CycleGAN) erzeugten erweiterten Bilder des nächtlichen Verkehrs zu verwenden, um die Leistung der Nachterkennung zu verbessern. Mit CycleGAN werden übertragene Nachtverkehrsbilder durch die Verwendung von Tagesverkehrsbildern generiert, da beide die gleichen Annotationen von Verkehrsinstanzen am Tag aufweisen. Zum Vergleich werden verschiedene Lernraten und Ausschnittgrößen für die Übertragung von Verkehrsbildern von Tag auf Nacht verwendet. Das sonst vorgeschlagene Erkennungsnetzwerk, das "Dense Traffic Detection Network" (DTDNet), wird zum Training des vorbereiteten Bilddatensatzes verwendet. Die Indikatoren der mittleren durchschnittlichen Präzision (mean average precision, mAP), der Präzision und der Wiedererkennung werden für die Bewertung und den Vergleich der Trainingsleistung verwendet. Basierend auf den Visualisierungsergebnissen hat CycleGAN mit einer Lernrate von 2e-5 (2x10-5) und einer Crop-Größe von 64 (der Formatfaktor sagt etwas über die Verkleinerung der lichtempfindlichen Fläche aus) eine bessere Leistung bei der Übertragung von Tag-zu-Nacht-Verkehrsbildern mit dem vorgeschlagenen Bilddatensatz. Betrachtet man die Indikatoren der Trainingsleistung, so weist DTDNet mit 60 % der übertragenen Nachtbilder und 40 % der Originalbilder eine bessere Genauigkeit in vier Kategorien auf. Insgesamt bietet die Studie eine mögliche Lösung für das Problem der begrenzten Trainingsdaten bei der nächtlichen Verkehrserkennung und demonstriert das Potenzial der GAN-basierten Datenerweiterung im Verkehrsbereich.