Your browser doesn't support the features required by impress.mod.js, so you are presented with a simplified version of this presentation.
For the best experience please use the latest Chrome, Safari or Firefox browser.
12.10.2016 | ISS | Mainz
Annotation & Kodierung
Verstehen - Auszeichnen - Abfragen
Einführungskurs der 1. International Summer School des Studiengangs “Digitale Methodik in den Geistes- und Kulturwissenschaften”, 10.–14.10.2016
J. Hambuch (ADWL Mainz) | M. Grüntgens (ADWL Mainz) | D. Kasper (ADWL Mainz) | J. Kühner (ADWL Mainz) digitale-akademie.de |
@digicademy |
digicademy |
Docs@ISS
Released under
CC BY 4.0 (Max Grüntgens, Dominik Kasper, Janina Kühner; Digitale Akademie)
verknüpfte Technologie: JavaScript (JSON selbst ist in den meisten Fällen bereits valides JavaScript), JSONB, JSON-LD ...
Beispiel
Konzepte und Sprache
RDF
Beschreibung
Resource Description Framework
Paradigma zur Formulierung von logischen Aussagen über Entitäten
Triple bzw. Subjekt-Prädikat-Objekt-Notation
mehr formales Prinzip als Auszeichnungssprache - in verschiedenen Formaten notierbar (auch in XML)
Hauptanwendungsgebiete: Datenaustausch, Verknüpfung von Ressourcen im Semantic Web
verknüpfte Technologie: SPARQL, OWL, ...
Beispiel - Korrespondenz in ...
XML
RDF (Turtle-Notation)
Verbreitete Software und Technologien (XML)
eXist - Native XML-Datenbank
Verwaltungssystem für XML-Dokumente
Datenbankmanagementsystem
Web-Applikations-Engine
javabasiert - wird in JVM ausgeführt
Oxygen XML Editor
Entwicklungs-Umgebung für X-Technologien (XML, XPath, XQuery, XSLT)
XML-Editor
volle TEI-Unterstützung
Schnittstelle für eXist-db
Oxygen mit eXist verbinden
(bitte jetzt durchführen)
Fenster -> Ansicht zeigen -> Datenquellen Explorer. Dann in der geöffneten Ansicht auf Rechtsklick auf Verbindungen und dann Datenquellen konfiguieren….
Jetzt auf Eine eXist-db-XML-Verbindung erstellen klicken und Folgendes eingeben:
Host: exist-iss.adwmainz.net
Port: 443
Benutzer: “Benutzername”
Passwort: “Benutzerpasswort”
eXist Admin Client JWS: webstart/exist.jnlp
Bibliotheken: “SPEICHERORT der Oxygen-Bib mit den Treibern” (standardwert sollte passen)
☑ bei SSL
Ok klicken.
XML und TEI
Überblick
Was ist XML?
Syntax - Elemente, Attribute und Werte, Kommentare
Wohlgeformtheit
Validität
TEI
Was ist XML?
XML = Extensible Markup Language
Dokumentformat --> allgemeines Datenformat
entwickelt vom World-Wide-Web-Konsortium (W3C), 1996
plattformen- und anwendungsunabhängige Beschreibung und Strukturierung von Daten
Inhaltsbeschreibungssprache, keine Programmiersprache
Syntax
Allgemein
einfacher Kern
logischer Aufbau mit zwei Datenklassen: Markup und Text
Markup enthält Elemente, Attribute und Wertzuweisungen
Veranschaulichung
Syntax - Elemente
Definition von Tags: <elementName>text</elementName>
enthält Text, andere Elemente oder eine Kombination aus beiden
case-sensitive
Syntax - Attribute und Werte
Spezifizieren die Werte eines Elements
stehen in doppelten Anführungszeichen
<person age="adult">text</person> --> Attribut age mit dem Wert adult
keine zwei Attribute desselben Namens innerhalb eines Elements
Syntax - Kommentare
<!-- This is a comment. -->
Beschreibung der Dokumentstruktur
Auskommentierung in Entwicklungs- und Testphase
keine Elemente, daher kein endTag
Wohlgeformtheit
syntaktische Regeln sind eingehalten
case-sensitive: <startTag> und <StartTag>
Ein startTag muss auch ein endTag besitzen.
korrekte Verschachtelung der Elemente
leeres Element: <person/>
Leerzeichen oder Tabulatoren sind in Element- oder Attributnamen nicht erlaubt.
Validität I
Wohlgeformtheit des Dokuments
Dokumenttypen-Definition (DTD)
Vokabular zur Beschreibung von Datenstrukturen
hierarchische Zusammenhänge in Form einer Baumstruktur
XML-Schema
2001 vom W3C als Standard verabschiedet
im Unterschied zur DTD in einer XML-Syntax geschrieben
Die Inhalte der Elemente <color bgc="cyan"> in der Datei "article_encyclopedia.xml" in einer <autorenliste> in Listenpunkten <autor> in alphabetischer Reihenfolge ausgeben lassen.
Die Abbildung correspDesc.png stammt von: http://correspsearch.net/index.xql?id=participate_cmi-format&l=de
Alle weiteren Inhalte, Illustrationen und Bilder sind frei zur Weiterverwendung und Modifikation. Lizenz: CC-BY 4.0, Digitale Akademie der Akademie der Wissenschaften
und der Literatur | Mainz