Your browser doesn't support the features required by impress.mod.js, so you are presented with a simplified version of this presentation.

For the best experience please use the latest Chrome, Safari or Firefox browser.

12.10.2016 | ISS | Mainz

Annotation & Kodierung

Verstehen - Auszeichnen - Abfragen

Einführungskurs der 1. International Summer School des Studiengangs “Digitale Methodik in den Geistes- und Kulturwissenschaften”, 10.–14.10.2016

J. Hambuch (ADWL Mainz) | M. Grüntgens (ADWL Mainz) | D. Kasper (ADWL Mainz) | J. Kühner (ADWL Mainz)
Twitter digitale-akademie.de | Twitter @digicademy | Twitter digicademy | Docs@ISS

Released under CC BY 4.0 (Max Grüntgens, Dominik Kasper, Janina Kühner; Digitale Akademie)

Table of Contents

01

Verstehen

Was bedeutet Annotation & Kodierung?

Erklärung

  • Standardisierte Anbringung von Zusatzinformationen an ein digitales Primärobjekt
    • Art der Zusatzinformationen beispielsweise: deskriptiv, analytisch oder semantisch
  • gängige Begrifflichkeiten: Annotation, Auszeichnung, Tagging, Kodierung, Metadaten
    • Art des Markups: prozedural/präsentational oder deskriptiv

Beispiel - Annotation

Abbildung annotierter Text (Goethe-Tagebuch)

Weiterführendes

Welchem Zweck dient es?

Allgemein

  • Maschinenlesbarkeit
  • implizite Informationen explizit machen, z. B.
    • Beschreibung der formalen Struktur
    • Bezugssysteme digitalisieren
    • Analyse linguistischer Merkmale
    • Erläuterung der inhaltlichen Bedeutung von Textpassagen
  • Kategorizierung bzw. Strukturierung

In unserem Kontext

  • Standardisierung für interoperable Nutzung
  • Datenaustausch
  • Langzeitarchivierung
  • Digitales Publizieren

Was soll ausgezeichnet werden?

02

Auszeichnen

Konzepte und Sprache - XML

Beschreibung

  • Exensible Markup Language
  • umschließendes Tagging
  • hierarisch
  • weit verbreitet
  • Hauptanwendungsgebiete: Digitales Publizieren, Langzeitarchivierung, Datenaustausch
  • verknüpfte Technologien: XPath, XSLT, XQuery ...
  • mehr dazu gleich von Janina ;-)

Konzepte und Sprache - JSON

Beschreibung

  • JavaScript Object Notation
  • Key-Value-Prinzip
  • nicht deklarativ
  • mehr Datenformat als Auszeichnungssprache
  • Hauptanwendungsgebiete: überwiegend Datenaustausch
  • verknüpfte Technologie: JavaScript (JSON selbst ist in den meisten Fällen bereits valides JavaScript), JSONB, JSON-LD ...

Beispiel

SCreenshot des JSON-Format

Konzepte und Sprache

RDF

Beschreibung

  • Resource Description Framework
  • Paradigma zur Formulierung von logischen Aussagen über Entitäten
  • Triple bzw. Subjekt-Prädikat-Objekt-Notation
  • mehr formales Prinzip als Auszeichnungssprache - in verschiedenen Formaten notierbar (auch in XML)
  • Hauptanwendungsgebiete: Datenaustausch, Verknüpfung von Ressourcen im Semantic Web
  • verknüpfte Technologie: SPARQL, OWL, ...

Beispiel - Korrespondenz in ...

XML

Beispiel CMI-XML

RDF (Turtle-Notation)

Beispiel RDF-Turtle

Verbreitete Software und Technologien (XML)

eXist - Native XML-Datenbank

  • Verwaltungssystem für XML-Dokumente
  • Datenbankmanagementsystem
  • Web-Applikations-Engine
  • javabasiert - wird in JVM ausgeführt

Oxygen XML Editor

  • Entwicklungs-Umgebung für X-Technologien (XML, XPath, XQuery, XSLT)
  • XML-Editor
  • volle TEI-Unterstützung
  • Schnittstelle für eXist-db

Oxygen mit eXist verbinden

(bitte jetzt durchführen)

XML und TEI

Überblick

  1. Was ist XML?
  2. Syntax - Elemente, Attribute und Werte, Kommentare
  3. Wohlgeformtheit
  4. Validität
  5. TEI

Was ist XML?

Syntax

Allgemein

  • einfacher Kern
  • logischer Aufbau mit zwei Datenklassen: Markup und Text
  • Markup enthält Elemente, Attribute und Wertzuweisungen

Veranschaulichung

Veranschaulichung - XMl als Baumstruktur

Syntax - Elemente

Syntax - Attribute und Werte

Syntax - Kommentare

Wohlgeformtheit

Validität I

Validität II

TEI

03

Abfragen

XPath

Erklärung

  • Syntax zur Definition von Teilen in einem XML-Dokument (Knoten, Geschwister, Kinder, Vorfahren, Nachfahren ...)
  • Ausdruckweise zur Navigation innnerhalb von XML-Dokumenten (Achsen)
  • Kenntnisse sind Voraussetzung zum Einsatz von XSLT und XQuery
  • Bitte öffnen: XPath Syntax

Aufgaben

  1. Datei: correspDesc.xml öffnen, dann folgendes via XPath auswählen/ermitteln:
    1. Alle Orte anzeigen auswählen
    2. Alle Sender oder Empfänger auswählen
    3. Alle Empfangsorte ohne Link zr Normdatei
    4. Alle Korrespondenz-Beschreibungen, die Links zu ihrer Online-Editionen haben
  2. Datei: letter.xml öffnen, dann folgendes via XPath auswählen/ermitteln:
    1. Alle Inhalte von sämtlichen Element im Brieftext, die irgendeine Art von Name umschließen (Datei genau anschauen)

XQuery

Erklärung

  • Die Abfragesprache für XML-Daten (Dateien und Datenbanken)
  • basiert auf XPath
  • XQuery-Abfragen können direkt mit HMTL umschlossen ausgegeben werden
  • Prinzip FLWOR ("For, Let, Where, Order by, Return")
    • For - Wählt eine Sequenz von Knoten aus
    • Let - Bindet eine Sequenz an eine Variable
    • Where - Filterkritieren
    • Order by - Sortierkriterien
    • Return - Ausgabe
    • Bitte öffnen: XQuery Syntax

Aufgaben

  • Bitte zuschauen und mitdenken
  • Die Inhalte der Elemente <color bgc="cyan"> in der Datei "article_encyclopedia.xml" in einer <autorenliste> in Listenpunkten <autor> in alphabetischer Reihenfolge ausgeben lassen.

Vielen Dank für Ihre Aufmerksamkeit

Literature

Software

Erwähnt

Verwendet

Rechte