Digital Geo Media ist in die Lehre integriert und Studierende profitieren schon jetzt davon. Es wird damit die bisher ungenutzte Verknüpfung des Raumbezugs und das Verständnis bei der Verwendung von digitalen Medien in unserer Hochschule ermöglicht. Die Studierenden erhalten Einblicke in Methodiken und Datengrundlagen, die so in den bestehenden Modulen der beiden Studiengänge bisher noch nicht vorgesehen waren, aber im Kontext von Datenkompetenz und Digitaler Souveränität in der heutigen Zeit und auch für unsere Studierenden zunehmend von großer Wichtigkeit sind.
Künftige Ergebnisse werden während der Projektlaufzeit hier kontinuierlich ergänzt.
1, Automatisierte Georeferenzierung deutscher Nachrichtenartikel – Am Beispiel der tagesschau
Wie und mit welcher Qualitätsgüte können deutsche Nachrichtenartikel georeferenziert werden? Mit dieser Fragestellung starteten die Studierenden Lukas Kauf und Fabian Püschel die Projektarbeit mit dem Titel "Automatisierte Georeferenzierung deutscher Nachrichtenartikel – Am Beispiel der tagesschau" im Rahmen des Mastermoduls Geogovernment 2 im Studiengang Geoinformatik und Vermessung. Sie entwickelten eine Methodik, mit der sich verschiedene Geotagging Systeme evaluieren lassen (siehe Abbildung 1). Hierbei wurde ein manuell erstellter Referenzdatensatz aus 120 Nachrichtenartikeln mit den Ergebnissen aus englisch und deutschsprachig spezialisierten Taggern verglichen.
Die Ergebnisse in Abbildung 2 zeigen, dass in diesem Untersuchungsfall der Geotagger der Universität Stanford, der auf deutsche Texte trainiert ist, mit einem F1 Score von 0.77 am besten abgeschnitten hat. Mit vergleichbar vielen korrekten Toponymen, aber einer erhöhten Anzahl an "falsch positiven" Klassifizierungen, schnitten das Komplettsystem der Universität "Edinburgh", das englischsprachige Modell der Universität "Stanford", sowie das multilinguale Model von "Spacy" geringfügig schlechter ab.
3, Visual Analytics & Datenvisualisierung mit Hands-on Session
Ein wesentlicher Bestandteil von Datenjournalismus liegt in der visuellen Analyse von Daten und Informationen, um diese für eine breite Masse zugänglich zu machen. Den Studierenden wurden in der Option "Datenjournalismus und -visualisierung" Ansätze zur visuellen Analyse und Datenvisualisierung vorgestellt. Anschließend haben die Studierenden mithilfe der webbasierten Anwendung Datawrapper (https://www.datawrapper.de) eigene Daten analysiert und visualisiert (z.B. in Form von Balken- und Säulendiagrammen).
4, Visuelle Kommunikation mit Geodaten - Einblick in Visual Analytics in Deep Learning und Datenvisualisierung mit Hands-on Session
Im Modul "Digitale Kommunikation" wurden verschiedene Ansätze zur visuellen Analyse und Kommunikation mit räumlichen Daten vorgestellt (z.B. Kommunikation über Karten). Die Studierenden haben das theoretische Wissen anschließend praktisch umgesetzt, indem beispielhafte Datensätze analysiert und interessante Aspekte auf Karten visualisiert wurden.
5, Ungenutzte Informationen in Social Media Posts - Raumbezug und Sentimentanalyse
Das Ziel dieser Studie war es, die Fragestellung zu beantworten, wie sich Sentiments in Social Media Posts über Sehenswürdigkeiten in Mainz anhand ungenutzter Daten erfassen und analysieren lassen, sowie welchen Mehrwert diese in Zukunft bieten könnten. Hierfür wurden zwei grundlegende Arbeitsschritte durchgeführt: Datensammlung und Datenauswertung. Im Rahmen der Datensammlung wurden geeignete Instagram-Posts ausgewählt und einer Ortsangabe (Georeferenzierung) zugeordnet. Die Posts wurden in 10 Kategorien von Sehenswürdigkeiten unterteilt. In der Datenauswertung erfolgte eine Sentiment-Analyse für jede Sehenswürdigkeit. Es wurden Untersuchungen zur Korrelation zwischen Likes und Sentiments sowie zwischen Follower- und Like-Anzahl und dem Zusammenhang zwischen Likes, Wochentagen und Sentiments durchgeführt. Im folgenden Abschnitt werden die Ergebnisse der Studie beschrieben.
Die Studie hat sich darauf konzentriert, das vorherrschende Sentiment gegenüber verschiedenen Sehenswürdigkeiten in Mainz zu bestimmen. Es wurde eine Analyse durchgeführt, bei der alle Sehenswürdigkeiten verglichen wurden, um festzustellen, welches Sentiment in den ausgewählten Posts am häufigsten vorkommt. Die Mainzer Altstadt und der Mainzer Volkspark wurden am positivsten bewertet, während der Mainzer Hauptbahnhof die unbeliebteste Sehenswürdigkeit war (siehe Abbildung 1). Es wurde auch festgestellt, dass die Gesamtanzahl von Likes kein Indikator für eine positive Bewertung einer Sehenswürdigkeit ist, wie es bei der Mainzer Neustadt der Fall war (siehe Abbildung 2).
Die Studierenden haben auch eine Analyse der Wochentage durchgeführt (siehe Abbildung 3) und festgestellt, dass am Donnerstag mit Abstand die wenigsten Beiträge gepostet wurden. Die meisten Beiträge wurden sonntags und montags veröffentlicht, aber der Tag mit den meisten Likes war Dienstag. Donnerstags werden die meisten Likes im neutralen Sentiment vergeben. Influencer könnten von diesen Ergebnissen profitieren, indem sie Beiträge an einem Donnerstag veröffentlichen, um potenziell mehr Likes zu erhalten. Sonntags überwiegen die positiven Likes im Vergleich zu anderen Sentiments.
In der Auswertung der Follower-Anzahl zeigt sich, dass der Mittelwert bei 3.703 liegt, jedoch der Median mit 667 eine bessere Darstellung des durchschnittlichen Instagram-Nutzers liefert. Die Abweichung kommt durch Influencer-Profile mit über 10.000 Followern zustande. Die größte Follower-Anzahl beträgt 177.000, hat jedoch nur 343 Likes. Der Mittelwert der Likes liegt bei 183,74 und es besteht ein mittelstarker positiver Zusammenhang zwischen Likes und Followern mit einer Korrelation von 0,41.
Dieses Projekt wurde von Malte Schildmann, Luca Fahl, Sophie Schraml, Sarah Schnabel, Delphine Pourikas durchgeführt.