Zurück Vor

Detailergebnis zu DOK-Nr. 82445

Feature-Engineering und Entscheidungsbäume zur Vorhersage von hochrisikoreichen Unfallorten anhand von Straßenindikatoren (Orig. engl.: Feature engineering and decision trees for predicting high crash-risk locations using roadway indicators)

Autoren D. Sarigiannis
M. Atzemi
J. Christofa
S. Gerasimidis
Sachgebiete 6.3 Verkehrssicherheit (Unfälle)
0.11 Daten (EDV, IT, Internetanwendungen und Verkehrsdaten)
1.4 Statistik (Straßen, Kfz, Unfälle)

Transportation Research Record (TRR): Journal of the Transportation Research Board Vol. 2678, H. 8, 2024, S. 535-548, 8 B, 5 T, zahlr. Q. - Online unter: https://journals.sagepub.com/home/trr

Verkehrsunfälle sind ein weit verbreitetes Problem im Bereich der öffentlichen Gesundheit weltweit. Ziel dieser Forschung war es, eine Methodik zu entwickeln, um Hochrisiko-Unfallorte genau zu klassifizieren. Die Hypothese dieser griechischen Studie in Zusammenarbeit mit der University of Massachusetts in Amherst (USA) war, dass leicht erhältliche Straßenindikatoren zusammen mit maschinellen Lerntechniken verwendet werden können, um Standorte als Hochrisiko für Unfälle zu kategorisieren. Eine Datenbank mit 5 383 Standorten wurde in den Jahren 2012 bis 2015 im Rahmen des „Hellenic National Road Safety Project“ erstellt und genutzt, um drei binäre maschinelle Lernmodelle zu entwickeln, die Hochrisiko-Unfallorte anhand von Straßenindikatoren klassifizieren. Die drei Modelle waren Random Forest, Gradient Boosting und Extra Trees. Diese Forschung nutzte Feature-Engineering (die Vorbereitung von Daten für die Verarbeitung in Machine Learning-Algorithmen), um die Anzahl der Indikatoren im Modell zu reduzieren, und die Synthetic Minority Oversampling Technique, um Ungleichgewichte im Datensatz zwischen der Minderheit (Standorte mit hohem Unfallrisiko, identifiziert anhand von Unfallberichten) und der Mehrheit (Standorte mit mittlerem bis niedrigem Unfallrisiko, identifiziert anhand von Zeugenaussagen der Polizei, Standortinspektionen und Geometrieanalysen) zu adressieren. Obwohl alle drei Modelle ähnliche Leistungen erbrachten, übertraf das Extra-Trees-Modell die anderen beiden in einer Reihe von Leistungskennzahlen, einschließlich der Fläche unter der Precision-Recall-Kurve und dem F1-Score. Die Ergebnisse zeigten, dass Entwurfsgeschwindigkeiten, Fahrbahnmarkierungen, Vorhandensein von Beschilderungen und Fahrbahnzustand die einflussreichsten Faktoren für die Straßenverkehrssicherheit sind. Der Beitrag dieser Forschung liegt in der Entwicklung einer übertragbaren Methodik zur Klassifizierung von Standorten mit hohem Unfallrisiko sowie in der Offenlegung der Schlüsselindikatoren für das Unfallrisikopotential, die wiederum eine kosteneffiziente Planung informieren können.