This content is only partially available in English.

Historische Datenanalyse unter Einsatz Di­gi­ta­ler Methoden

Das Lemmatisieren, Kommentieren, Metadatieren und Überführen der Variae in TEI/XML-codierte Form als einheitlichem Standard (Text Encoding Initiative) gewährleistet die Anwendbarkeit verschiedener digitaler Analysetools auf das Datenmaterial, was neue Forschungsperspektiven eröffnet.

Die Lemmatisierung der Schriftstücke verbessert die Trefferqualität von Suchanfragen: So lässt sich in einer Wortfeldsuche in einem lemmatisierten Text z.B. zwischen lat. populus (das Volk) und lat. pōpulus (die Pappel) unterscheiden. Ferner konnten bei Suchanfragen Kasusflexionen (lat. popul-orum), graphische Varianten (z.B. lat. popvlvs statt lat. populus) sowie syntaktische Bezüge (z.B. Kongruenz in Kasus, Numerus und Genus) berücksichtigt werden.

Dies ermöglichte wiederum genauere korpusbasierte linguistische Analysen. Beispielsweise konnten die drei unterschiedlichen Sprachniveaus, die Cassiodor in seiner Praefatio ankündigt, in Hinblick auf verschiedenste formale Parameter untersucht werden (z.B. hapax legomena, Type-Token-Ratio, Lexical Density). In einem weiteren Schritt konnten die so erbrachten Befunden mit qualitativen Eigenschaften der Briefe, d.h. mit ihren Metadaten, in Verbindung gebracht werden (z.B. mit dem Bildungsstand des Empfängers und/oder mit der Präsenz von inhaltlichen Digressionen).

Darüber hinaus erlaubte die Lemmatisierung der Variae eine statistische Auswertung, beispielsweise hinsichtlich von Wortverteilungen in den einzelnen Büchern, deren Visualisierung, aber auch Kookkurrenzanalysen. Hierbei handelte es sich um eine korpusanalytische Methode, mithilfe welcher das gemeinsame Auftreten von lexikalischen Einheiten (z.B. populus und Romanus) in Hinblick auf seine statistische Signifikanz untersucht werden konnten. Durch einen Vergleich mit anderen Textkorpora ließen sich zudem intertextuelle Bezüge Cassiodors nachweisen und sprachliche Entwicklungen des Spätlateins hin zum Mittellatein abbilden.

Kookkurrenzanalyse am Beispiel von lat. populus (EHuDesktop)

Ein Anreichern jedes einzelnen Schriftstückes mit Metadaten bereitete die Filterung der Variae nach verschiedenen Suchparametern vor, die sich miteinander kombinieren ließen. Dies ermöglichte ein von der jeweiligen Fragestellung abhängige zielgenaues Ansteuern einzelner Texte und Textteile, zum Beispiel aller Schreiben Theoderichs des Großen an Amtsträger in Ligurien aus der Zeit zwischen 507 und 513, die sich mit Fragen des Steuerwesens befassen.

Das Kommentieren z.B. der in den Variae genannten Personen erlaubte es, deren vielfältige Beziehungen hinsichtlich ihrer Qualität (politisch, wirtschaftlich, rechtlich, verwandtschaftlich etc.) und Quantität abzubilden, wobei durch den Einsatz digitaler Werkzeuge Überschneidungen und Devianzen in den verschiedenen Personennetzwerken visualisiert wurden.

Personenkommentar „Alarich II.“ (QAnnotate)

Durch das Zuweisen raumbezogener Informationen zu dem jeweiligen Datensatz (Georeferenzierung) ließen sich die Resultate derlei Suchanfragen geographisch visualisieren.

DARIAH-DE Geo-Browser mit DataSheet