Detailergebnis zu DOK-Nr. 79509
Echtzeit-Twitter-Data-Mining-Ansatz zur Ermittlung der Nutzendenwahrnehmung in Bezug auf aktive Mobilität (Orig. engl.: Real-time twitter data mining approach to infer user perception toward active mobility)
Autoren |
R. Rahman K. Redwan Shabab K. Chandra Roy M.H. Zaki S. Hasan |
---|---|
Sachgebiete |
0.11 Daten (EDV, IT, Internetanwendungen und Verkehrsdaten) 6.1 Verkehrserhebungen, Verkehrsmessungen |
Transportation Research Record: Journal of the Transportation Research Board Vol. 2675, H. 9, 2021, S. 947-960, 7 B, 3 T, 61 Q. - Online-Ressource: verfügbar unter: http://journals.sagepub.com/home/trr
In der Studie wird das Angebotsniveau von gemeinsam genutzten Verkehrsmitteln durch die Auswertung von mit Geotags versehenen Daten aus sozialen Medien und die Analyse der Wahrnehmungen von Verkehrsteilnehmenden bewertet. Es wurde ein Algorithmus entwickelt, der einen Textklassifizierungsansatz mit kontextuellem Verständnis verwendet, um relevante Informationen herauszufiltern, die mit den Wahrnehmungen der Nutzenden in Bezug auf aktive Mobilität zusammenhängen. Bei der Verwendung eines heuristischen, auf Schlüsselwörtern basierenden Ansatzes werden etwa 75 % der Tweets aus dem Kontext gerissen, sodass dieser Ansatz als ungeeignet für die Informationsextraktion aus Twitter angesehen wird. Die Studie implementiert sechs verschiedene Textklassifizierungsmodelle und vergleicht die Leistung dieser Modelle für die Klassifizierung von Tweets. Das Modell wird auf reale Daten angewendet, um relevante Informationen herauszufiltern, und es wird eine Inhaltsanalyse durchgeführt, um die Verteilung der Schlüsselwörter in den gefilterten Daten zu überprüfen. Das Textklassifizierungsmodell "Termfrequenz-umgekehrte Dokumentenhäufigkeit", das auf einem Vektorisierer basiert, schnitt bei der Klassifizierung der Tweets am besten ab. Um das beste Modell auszuwählen, werden die Leistungen der Modelle anhand von Präzision, Recall, F1-Score (geometrisches Mittel aus Präzision und Recall) und Genauigkeitsmetriken verglichen. Die Ergebnisse der Analyse zeigen, dass die vorgeschlagene Methode dazu beitragen kann, relevantere Informationen über Fuß- und Radverkehrseinrichtungen sowie Sicherheitsbedenken zu erhalten. Durch die Analyse der Stimmungen in den gefilterten Daten können Rückschlüsse auf den Zustand der Fuß- und Radverkehrsanlagen in der Region District of Columbia gezogen werden. Diese Methode kann ein wichtiger Bestandteil des Entscheidungsunterstützungssystems sein, um den qualitativen Angebotsgrad der bestehenden Verkehrseinrichtungen zu verstehen.