This content is only partially available in English.

Das Erstellen einer digitalen Edition der Variae des Cassiodor

Durch das Erstellen einer digitalen Edition der Variae des Cassiodor in TEI/XML-codierter Form lagen diese in einem einheitlichen Standard (Text Encoding Initiative) vor. Die Verwendung eines solchen Standards gewährleistete eine Interoperabilität, insofern als die Daten für verschiedene digitale Anwendungen lesbar und skriptgesteuert vergleichbar sind sowie in verschiedene Ausgabeformate (PDF, HTML etc.) überführt werden konnten.

Hierfür wurde jedes einzelne der 470 Schriftstücke lemmatisiert, kommentiert, mit Metadaten versehen und in TEI/XML konvertiert.

Ausgangsmaterial für die projektbezogene Aufbereitung der Texte war eine digitalisierte Ausgabe der Variae-Edition von Theodor Mommsen (MGH Auct. Ant. XII, Berlin 1894), die durch das Team der JGU mithilfe des EHuDesktop und mit Unterstützung des Teams Computational Historical Semantics der Johann Wolfgang Goethe-Universität Frankfurt (Prof. Dr. Bernhard Jussen) lemmatisiert wurde.

Lemmatisieren bedeutet die semantische und morphologische Bestimmung einer Wortform und deren Rückführung auf ihre Grundform (Lemma bzw. Superlemma): z.B. lat. regem (dt. „den König“ zu lat. rex (dt. „der König“).

EHuDesktop, Lemmatization Editor

Die semantische Bestimmung einer Wortform war insbesondere für die Unterscheidung von Homographen notwendig; z.B.

  • lat. pōpulus (dt. „die Pappel“) und lat. populus (dt. „das Volk“)
  • lat. regis (dt. „des Königs“) und lat. regis („du regierst“)
  • lat. legis (dt. „des Gesetzes“) und lat. legis (dt. „du liest“)
  • lat. mālus (dt. „der Apfelbaum“) und lat. mālus (dt. „der Mast“) sowie lat. malus (dt. „schlecht“)

Die morphologische Bestimmung bedeutet die Rückführung einer Wortform auf ihre Grundform und Bestimmung der Wortart unter Auszeichnung nach Kasus, Numerus, Genus, bzw. Person, Tempus, Modus, Genus verbi …

  • lat. artium: Genitiv, Plural, Feminin von lat. ars (dt. „die Kunst“)
  • lat. iunxerunt: 3. Person, Plural, Perfekt, Indikativ, Aktiv von lat. iungere (dt. „verbinden“)

… sowie unter Berücksichtigung unterschiedlicher graphischer Varianten:

  • lat. popvlvs auf lat. populus (dt. „das Volk“)
  • lat. copo auf lat. caupo (dt. „der Schankwirt“)

Gegenwärtig liegen 2 der 12 Bücher Variae sowie deren Praefatio (Liber I und III, 100 Schriftstücke) vollständig lemmatisiert, die übrigen teillemmatisiert und in TEI/XML-codierter Form für die weitere Bearbeitung vor: hudesktop.hucompute.org/index.jsp (Computational Historical Semantics der Johann Wolfgang Goethe-Universität Frankfurt).

Vollständig lemmatisierter Brief, hier Cassiod. Var. 1.1 (EHuDesktop, Lemmatization Editor)

Mithilfe der Anwendungen QAnnotate und TextGridLab wurde jedes einzelne der 470 Schriftstücke aus den Variae unter Einbindung von Bildmaterial, digitalen Handschriften und Georeferenzen historisch-philologisch kommentiert.

Kommentar Cassiod. Var. 3.1 (TextGridLab)
Personenkommentar „Alarich II.“ (QAnnotate)

Darüber hinaus wurde jedes einzelne Schriftstück der Variae mit Metadaten (tags) ausgezeichnet, d.h. mit Angaben zum Aussteller und Empfänger, zu Datierung, Inhalt, Textgattung sowie zu im Text erwähnten Orten, Personen, ethnischen, religiösen und soziale Gruppen. Aktuell ist der Liber Tertius der Variae (53 Schriftstücke) mit Metadaten angereichert.

Metadaten zu Cassiod. Var. 3.1 (QAnnotate)

Alle Dateien (lat. Text mit Metadaten, Lemmatisierung und Kommentierung) wurden in TEI/XML-codierte Form überführt.

Cassiod. Var. 3.1 in TEI/XML-codierter Form (Oxygen-Editor)