Detailergebnis zu DOK-Nr. 81004
Anwendung erklärbarer Techniken des maschinellen Lernens bei der Modellierung der täglichen Unfallhäufigkeit und -schwere für Autobahnen in ländlicher Umgebung (Orig. engl.: Applying explainable machine learning techniques in daily crash occurrence and severity modeling for rural interstates)
Autoren |
Z. Wei Y. Zhang S. Das |
---|---|
Sachgebiete |
0.11 Daten (EDV, IT, Internetanwendungen und Verkehrsdaten) 6.3 Verkehrssicherheit (Unfälle) |
Transportation Research Record: Journal of the Transportation Research Board Vol. 2677, H. 5, 2023, S. 611-628, 11 B, 6 T, 42 Q. − Online-Ressource: verfügbar unter: https://journals.sagepub.com/home/trr
Herkömmliche Methoden zur Analyse von Verkehrsunfällen verwenden häufig hoch aggregierte Daten, was es schwierig macht, die Auswirkungen zeitlich variabler Faktoren auf das Unfallgeschehen zu verstehen. Obwohl Studien Daten mit kleinen Aggregationsintervallen verwendet haben, analysieren sie in der Regel die Auswirkungen eines einzelnen Faktors auf das Unfallgeschehen. In der Studie wurde das Zusammenwirken von Fahrbahngeometrie, Geschwindigkeitsverteilung und Wetterbedingungen auf das Auftreten und die Schwere von Unfällen mithilfe von Methoden des erklärenden maschinellen Lernens auf täglichen Unfalldaten untersucht. Die Daten wurden auf ländlichen Interstate-Autobahnen in Texas erhoben. Vier Methoden des maschinellen Lernens (Random Forest, AdaBoost, XGBoost und Deep Neural Network) wurden mit dem Datensatz getestet. Die Ergebnisse zeigten, dass XGBoost bei dem unausgewogenen Datensatz am besten abschneidet. In der Studie wurde die Methode des synthetischen Minoritäts-Oversamplings (SMOTE) verwendet, um das Problem des Datenungleichgewichts zu entschärfen. Das XGBoost-Modell wurde separat für alle Unfälle und schwere Unfälle trainiert. Schließlich wurde die SHAP-Methode (eine Technik, mit der die Vorhersagen von Machine-Learning-Modellen auf vielseitige und leistungsstarke Weise erklärt werden können, ausgeschrieben SHapley Additive exPlanation) angewandt, um den Beitrag aller Variablen zum Ergebnis des Modells zu untersuchen. Die Ergebnisse zeigten, dass die Faktoren der Wetterbedingungen einen signifikanten Beitrag zu allen Unfallereignissen leisten. Faktoren der Geschwindigkeitsverteilung hatten einen stärkeren Einfluss auf das Auftreten schwerer Unfälle.