VERORTUNG VON POLIZEITWEETS
Ergebnisse einer Bachelorarbeit – präsentiert auf der FOSSGIS 2020
Analyse von 100 Tweets
In die Untersuchung flossen exemplarisch in Deutsch verfasste Tweets von Polizeibehörden ein. Zur Auswertung wurden ausschließlich bereits existierende Werkzeuge verwendet. Bestehende Anwendungen arbeiten jedoch nur mit englischen Tweets, z.B.„Mordecai“ (https://joss.theoj.org/papers/10.21105/joss.00091) oder der „Location Name Extractor“ (https://arxiv.org/abs/1708.03105 ). Svenja Ruthmann entwickelte daher den folgenden algorithmischen Ablauf: Der Text aus der Twitter-API wird weiterverarbeitet, indem Umlaute ersetzt sowie Links und Sonderzeichen, wie Hashtags oder Emoticons, entfernt werden. Für die Ermittlung der Ortsnamen unterteilt der Natural Language Prozessor „spaCy“ (https://spacy.io/) die Tweets in Entitäten, wie Nomen oder Verben. Um zu überprüfen, ob ein Tweet die Abkürzung eines KFZ-Kennzeichens enthält, werden alle Eigennamen mit einer selbst generierten Datenbank abgeglichen und gegebenenfalls im Tweet durch den vollständigen Namen ersetzt. Anschließend wird der Geocoder von „HERE“ (https://developer.here.com/ ) eingesetzt, um die Koordinaten zu generieren.