Einführung in die EpiDoc Richtlinien

2017-12-12

EpiDoc ist ein loser Zusammenschluss von Projekten sowie Wissenschaftlerinnen und Wissenschaftler, die antiken Quellen mittels Text Encoding Initiative (TEI) XML erarbeiten und hierzu Empfehlungen ausarbeiten, Werkzeuge identifizieren und „best practice“-Richtlinien in Bezug auf das Encoding, das Verarbeiten sowie das Publizieren dieser Texte formulieren. Die EpiDoc Homepage ist unter http://epidoc.sf.net zu finden.

Das vorliegende Dokument (die EpiDoc Richtlinien) ist ein sich ständig weiterentwickelndes Produkt, dass sich aus der langjährigen Erfahrungen der EpiDoc-Community speist. Die Richtlinien beschreiben, wie charakteristische Phänomene epigraphischer und papyrologischer Dokumente kodieren werden können. Die Richtlinien basieren – was die Transkription anbelangt – auf den allgemein akzeptierten Konventionen des sogenannten Leidener Klammersystems, was die beschreibende und historischen Bestandteile angeht – auf den Datenmodellen des Electronic Archive of Greek and Latin Epigraphy (EAGLE). Die Richtlinien sollten im Zusammenspiel mit dem EpiDoc-Schema verwendet werden. So kann jedes im Entstehen begriffene EpiDoc-XML-Dokument bereits während der Bearbeitung gegen das Schema validiert werden, sodass dessen interne Konsistenz stets gewährleistet ist. Die EpiDoc-Beispiel-Stylesheets enthalten grundlegende Ausgabe-Funktionalitäten (Rendering), mit denen eine erste Lese- oder Druck-Ansicht generiert werden kann.

Dabei sind die EpiDoc-Richtlinien weder eine vollständige noch erschöpfende Einführung in Umsetzung und Planung eines EpiDoc-Projekts, oder die Erstellung einer Webseite mit X-Technologien, die Implementierung eines Such-Werkzeuges oder die Realisierung anders gearteter technischer oder kollaborativer Arbeitsaufgaben. Es wird auch keine erschöpfende Einführung in die epigraphischen Fachdisziplinen oder die Papyrologie gegeben. Die Richtlinien verstehen sich dagegen ausschließlich als Leitfaden zur Kodierung der am häufigsten auftretenden Phänomene antiker Quellendokumente deren Edition und jeweiligen Spezifika in XML.

Da sich Konventionen, Strukturen und Aufbau epigraphischer und papyrologischer Editionen im Detail durchaus voneinander unterscheiden können, orientieren sich die EpiDoc-Richtlinien und die dazugehörigen EpiDoc Stylesheets an Datenmodellen, wie sie beispielsweise in Projekten wie APIS, EAGLE und Programme d’enregistrement, de traitement et de recherche automatique en épigraphie (PETRAE) erstellt wurden und noch immer eingesetzt werden. Da die Fachdisziplin der Epigraphik im Allgemeinen, und der digitalen Epigraphik im Besonderen, bereits über ein ausgeklügeltes System von Verfahren und Methoden verfügt, mit deren Hilfe eine Edition aufgebaut und strukturiert wird, empfehlen wir im Folgenden nur diejenigen Verfahren, Daten und Beobachtungen in die Praxis der XML-Kodierung zu überführen, deren Nützlichkeit bereits bewiesen ist und die sich in der Praxis als unverzichtbar erwiesen haben.

Die Richtlinien wollen das Leidener Klammersystem (im folgenden "Leiden"), das bereits seit über 80 Jahren in der Epigraphik sowie der Papyrologie Verwendung findet und in vielen philologischen und dokumentatorischen Kontexten verstanden wird, zu ergänzen. Die Richtlinien sehen das Leidener Klammersystem als adäquate Grundlage an, auf der die in vormodernen Texten zu findenden Phänomene sinnvoll kenntlich gemacht und aufgezeichnet werden können. Die Empfehlungen basieren auf dieser Grundlage, ohne sich dabei jedoch auf eine einzige Art der typographischen Repräsentation oder ein spezifisches Set von Siglen festzulegen. EpiDoc versucht, Phänomene – wie beispielsweise Textverlust – in der XML-Kodierung klar und eindeutig abzubilden, ohne jedoch eine spezifische Form der graphischen Repräsentation – beispielsweise in eckigen Klammern „[ ]“ – im XML-kodierten Dokument oder in einer wie auch immer gearteten Repräsentationsschicht zu erzwingen. Nichtsdestoweniger ist es so, dass ein in EpiDoc kodierter Text auf Basis der EpiDoc-Stylesheets standardmäßig auf Basis des Leidener Klammersystems dargestellt wird. Auf der Grundlage von TEI-XML ist es dabei theoretisch häufig möglich, bestimmte textuelle Phänomene feingranularer und tiefergehender zu annotieren, als dies auf Basis des Leidener Klammersystems möglich wäre. Einige dieser Annotationsmöglichkeiten werden zwar im Folgenden innerhalb der Richtlinien dargestellt, dennoch befürworten die Richtlinien in keinster Weise, die etablierte und standardisierte epigraphische sowie papyrologische Praxis durch solche neuartigen Verfahren zu ersetzen.

Die durch die EpiDoc-Community erstellten und empfohlenen Richtlinien sind eine Untermenge sowie spezialisierte Anpassung der TEI-Richtlinien, welche Empfehlungen für die XML-Kodierung einer großen Bandbreite an literarischen und historischen Texten sowie linguistischer Corpora aussprechen. Genauso wie es sich bei EpiDoc um eine Spezialisierung von TEI im Bezug auf antike Dokumente und Texte handelt, die nur diejenigen Elemente, Attribute und Objekte empfiehlt, welche sich als besonders nützlich für die Belange dieser Fachcommunity gezeigt haben, sollen die EpiDoc-Richtlinien die TEI-Richtlinien ergänzen jedoch auf keinen Fall ersetzen. Insbesondere die Referenz sowie das technische Kapitel der TEI bleiben darum stets eine außerordentlich wertvolle Quelle für alle EpiDoc-Nutzer. Dort findet man Listen der Elemente, Erläuterungen der Attributwerte oder der Datentypen sowie Anwendungsbeispiele aus zahlreichen Kontexten. Zusätzlich bieten die TEI-Richtlinien ausführliche Beschreibungen nützlicher Funktionen. Die EpiDoc-Richtlinien empfehlen eine eingeschränkte Untermenge an TEI-Elementen, content models, Attributen und Werten. Daher ist jede EpiDoc-Datei auch stets eine valide TEI-Datei, umgekehrt jedoch ist nicht jede TEI-Datei auch notwendigerweise immer auch eine valide EpiDoc-Datei. Dort wo die EpiDoc-Richtlinien restriktiver sind als die TEI-Richtlinien, sollten erstere an Stelle letzterer genutzt werden; dort hingegen, wo die TEI stärker ins Detail geht, oder ein breiteres Spektrum an Beispielen gibt, sollte ihr gegenüber EpiDoc der Vorzug gegeben werden.

Struktur und Charakteristika der EpiDoc-Richtlinien

Mehrere Einstiegspunkte in die EpiDoc-Richtlinien werden angeboten:

  • Inhaltsverzeichnisse strukturieren die Unterseiten nach drei Kategorien: Transkription (Charakteristika, welche sich auf Inhalt, Erscheinung, Wiederherstellung und grundlegende Interpretation des Textes selbst beziehen); Unterstützende Daten (beinhaltet die Beschreibung des Inschriftenträgers bzw. des Manuskriptes); und Vokabular und Indexierung (Begriffe und Charakteristika, welche im Text annotiert werden, um in der Folge zum Zweck der Kontrolle der Vokabular und Indizes, der Suchfunktionalitäten und Facetierung genutzt zu werden).
  • Mehrere Abschnitte bieten strukturierte Listen, welche Einstiegspunkte und Lernpfade darstellen, die sich an den Gewohnheiten spezialisierter Fachcommunities orientieren und diese in sinnvoller Weise durch die Richtlinien führen sollen (z.B. die epigraphischen Transkriptions-Richtlinien von Krummrey-Panciera; die papyrologischen Charakteristika wie sie innerhalb der APIS-Datenbank aufgezeichnet wurden).
  • Zu guter letzt bieten die Richtlinien ergänzende Anhänge, wie das Glossar technischer und spezialisierter Fachbegriffe, und eine Bibliographie epigraphischer und papyrologischer Autoritäten, beispielhafte EpiDoc-Corpora und digitaler Publikationen antiker Texte im Allgemeinen. Ein Index, bietet einen Zugang zu den Richtlinien auf Basis der TEI-Elementeund ermöglicht, sämtliche epigraphischen Charakteristika zu finden in denen ein bestimmtes Element Teil der empfohlenen Nutzung ist.

Die Unterseiten der Richtlinien sind eher nach epigraphischen oder papyrologischen Konzepten organisiert, weniger nach TEI-Elementnamen. Daher sind beispielsweise alle Seiten, die sich mit Abkürzungen beschäftigen, zusammen gruppiert worden, gleichgültig, ob spezifische TEI-Elemente vorkommen oder nicht (beispielsweise unterhalb der Rubrik „Editorische Eingriffe“). Jede Unterseite weist eine konsistente, wiederkehrende Struktur auf: Am Anfang steht eine knappe Erläuterung des Seitentitels (so wird beispielsweise der Titel der Seite „Uninterpretiertes Zeichen“ durch “Deutlicher aber unverständlicher Buchstabe” erläutert). Darunter werden die relevanten TEI-Elemente in einer Box angezeigt und mit der betreffenden Seite der TEI-Richtlinien verlinkt. Im Anschluss daran folgt eine umgangssprachlicher Erläuterungstext, der die EpiDoc-Empfehlung zur Benutzung des Elements sowie der damit zusammenhängenden Attribute und Werte enthält.

Unter dieser Erläuterung finden sich für gewöhnlich mehrere Anwendungsbeispiele in ihrem jeweiligen Kontext. In den Fällen, die sich auf Besonderheiten der Transkription beziehen, listen die Richtlinien auf, wie das infrage stehenden Phänomen mit den allgemeinen epigraphischen wie papyrologischen Transkriptionsrichtlinien (wie Krummrey-Panciera und die Duke-Datenbank) wiederzugeben wäre.

Die XML-Beispiele zeigen das empfohlene Markup für die einzelnen Varianten jedes Transkriptions-Charakteristikums an, z.B. werden verschiedene Varianten gezeigt, auf welche Weise Abkürzungen, die ein Symbol enthalten, aufgelöst werden können. Die Beispiele listen häufig mehrere Markup-Optionen auf, die sich im Detailgrad unterscheiden. Unterhalb der Beispiele wird gezeigt, wie das jeweilige Markup durch die EpiDoc-Stylesheets dargestellt und ausgegeben werden würde. Der Standard orientiert sich an der Krummrey-Panciera-Konvention. Außerdem stehen der SEG-Stil, der London-Stil und der DdbDP-Stil zur Verfügung. Unter jedem Beispiel findet sich eine Referenz zur Quelle. Die meisten Beispiele stammen aus den Inschriften von Aphrodisias, den Inschriften des römischen Tripolitanien und der Duke Datenbank dokumentarischer Papyri.

Training, Werkzeuge und Unterstützung

Die Richtlinien verstehen sich im Wesentlichen als Referenzwerk. Für tiefergehende Schulung oder weitergehende Unterstützung sind andere Ressourcen verfügbar. So halten Mitglieder der EpiDoc-Community gelegentlich Schulungen ab, die ab und zu von langfristigeren Projekten gefördert oder getragen werden (beispielsweise gab es in den Jahren 2004–2008 mehrere Workshops im Rahmen des Inschriften von Aphrodisias Projektes); mehr Information zu diesen Veranstaltungen findet man auf der Schulungsseite im EpiDoc-Wiki. Für Anfänger im Bereich EpiDoc und Text Encoding kann es sinnvoll sein eine allgemeine TEI-Schulung zu besuchen (siehe TEI Veranstaltungskalender).

EpiDoc kann mit standardmäßigen XML-Werkzeugen geschrieben und bearbeitet werden (für eine Liste siehe Editions Werkzeuge im TEI Wiki). Grundlegende Schulungen zum Umgang mit diesen Werkzeugen finden für gewöhnlich im Rahmen von EpiDoc- und TEI-Schulungen, oder auch allgemeinen XML-Schulungen statt. Andere digitale Werkzeuge mit denen EpiDoc- oder TEI-Dateien publiziert, durchsucht oder anderweitig weiterverarbeitet werden können sind unter anderem XSLT und Xquery sowie einige Suchplattformen wie Solr und die TEI-spezifischen und quelloffenen Werkzeuge Kiln und der Papyrological Navigator.

Wie immer, sollte der erste Anlaufpunkt für Hilfe bezüglich eines Themas, welche nicht in den Richtlinien besprochen wird, die Markup-Mailing-Liste sein.

Verantwortlich für diesen Abschnitt

  1. Gabriel Bodard, Autor
  2. Laura Löser, Autor
  3. Simona Stoyanova, Autor
  4. Charlotte Tupman, Autor
  5. Tom Elliott, Autor
  6. Max Grüntgens, übersetzt ins Deutsche
  7. Thomas Kollatz, übersetzt ins Deutsche

EpiDoc version: 9.0

Date: 2017-12-12