Detailergebnis zu DOK-Nr. 75705
Lernen täglicher Aktivitätssequenzen von Bevölkerungsgruppen unter Verwendung der Random-Forest-Theorie (Orig. engl.: Learning daily activity sequences of population groups using Random Forest theory)
Autoren |
M.H. Hafezi L. Liu H. Millward |
---|---|
Sachgebiete |
6.1 Verkehrserhebungen, Verkehrsmessungen 6.2 Verkehrsberechnungen, Verkehrsmodelle |
Transportation Research Record: Journal of the Transportation Research Board Vol. 2672, H. 47, 2018, S. 194-207, 5 B, 3 T, 33 Q. - Online-Ressource: Verfügbar unter: http://journals.sagepub.com/home/trr
Die Wahl der täglichen Aktivitätssequenzen unterscheidet sich zwischen Individuen auf der Grundlage ihrer soziodemografischen Merkmale und ihres Gesundheits- und/oder Mobilitätsstatus. Ziel der Arbeit ist es, eine verbesserte Methodik für das Lernen und die Modellierung der täglichen Aktivitätenmuster von Individuen unter Verwendung eines hochmodernen Algorithmus für maschinelles Lernen bereitzustellen. Die Abhängigkeiten zwischen Aktivitätstyp, Aktivitätshäufigkeit, Aktivitätssequenz und soziodemografischen Merkmalen der Individuen werden durch die Verwendung eines "Random-Forest-Modells" berücksichtigt. Um die Heterogenität und Diversität zwischen den Prädiktorvariablen zu erfassen, wurden im Random-Forest-Algorithmus zwei verschiedene Methoden zur geteilten Auswahl eingesetzt: CART (Classification and Regression Trees) und Krümmungssuche. Diese beiden Methoden wurden unter zwei verschiedenen Schichteinstellungen untersucht. In der ersten Einstellung lässt der Algorithmus Bäume unter Verwendung aller alternativen Prädiktorvariablen wachsen, während in der zweiten Einstellung die Wichtigkeit der Prädiktorvariablen geschätzt wird und der Algorithmus dann Bäume nur unter Verwendung von Prädiktorvariablen mit hoher Punktzahl wachsen lässt. Die Modelle wurden auf Zeitverwendungsdaten aus der großen STAR (Halifax Space Time Activity Research)-Haushaltsreisetagebuch-Erhebung angewandt. Es werden die Schätzgenauigkeit der vorgeschlagenen Modelle unter Verwendung von Konfusionsmatrix-, Übergangsmatrix- und sequentiellen Alignment-Techniken bewertet. Die Ergebnisse zeigen, dass das Random-Forest-Modell mit CART-Split-Auswahl unter Verwendung der Einstellung der ersten Schicht die beste Genauigkeit bei der Replikation von Aktivitätstagebüchern und Aktivitätssequenzen von Einzelpersonen aufweist. Es wird erwartet, dass die Ergebnisse der Arbeit im Rahmen des aktivitätsbasierten Verkehrsnachfragemodells "Scheduler for Activities, Locations, and Travel" (SALT) einbezogen werden.