Theoretische Grundlagen
Ontologie - Was es gibt, Linguistik/Semiotik - Wie Sprache/Zeichen funktionieren
Modellieren
Nützliche Vokabularien und Ontologien, RDF-Generierung, Modellierungsbeispiele
Technische Grundlagen
5-Star LOD, URIs, Triple, Vokabularien und Ontologien, RDFS/OWL, Normdaten
Serialisierungsformate, Reasoning, LOD als Basis für Nachnutzung, Bereitstellung
von LOD
Abfragen
SPARQL Grundlagen
Visualisieren
Visualisierungen mit sgvizler und d3sparql
01
Theoretische Grundlagen
Ontologie - Was es gibt
Linguistik/Semiotik - Wie Sprache/Zeichen funktionieren
Kategorien (1)
Aristoteles (384-322 BCE): K. als "Aussageschemata in Bezug auf etwas Seiendes. Aristoteles führt mit den Kategorien eine neue Art logischer Ausdrücke ein, die es erlaubt Prädikate von Subjekten zu unterscheiden und die Prädikate logisch zu klassifizieren. Es geht ihm darum, grundlegend und vollständig die Formen, nach denen einzelne Wörter sinnvoll zu Aussagen verbunden werden können, zu bestimmen. Seine Einteilung der Aussageschemata orientiert sich dabei an einfachen, nicht-zusammengesetzten sprachlichen Ausdrücken wie „Sokrates“, „Mensch“ oder „weiß“. Da Ausdrücke, Begriffe und Bezeichnetes nicht immer klar unterschieden sind, ist auch eine Lesart möglich, nach der zugleich die Wirklichkeit in Typen von Objekten und Eigenschaften eingeteilt werden (im Sinne einer Ontologie)." (Wikipedia)
Kategorien (2)
Ousia / Wesen als singuläres Individuum (z.B. Sokrates) => "Instanz"
indiv. Eigenschaften (dieses weiß, nur in Verbindung mit einer Instanz)
genus proximus/differentia specifica ("isA"-relation)
Ontologie und Vokabular
Welche Ebene? Referenz- vs. Domänen-Ontologie
Erklärung (differentia spec.) von allgemeinen Klassen: Disjunktion, Sein in der Zeit (Veränderbar, immer vollst. gegenwärtig, ...), strikte Vererbung von Eigenschaften an Unterklassen
Modellierung von Daten wie Zahlen, Zeichen - als Instanzen, Klassen, Attribute?
Strikte logische Regeln eingebaut (Ontologie) oder nicht (Vokabular)?
Mögliche Analysen mit Hilfe von Semantic Web Technologien
Welche historischen Personen existieren in allen Repositorien in welchen spezifischen Kontexten?
Welche kulturellen Objekte existieren zu welchen Zeiten in den verschiedenen Fachdatenkorpora?
Können bestimmte Muster im Auftreten bestimmter historisch-kultureller Phänomene aus den Daten gefolgert werden?
Auf Ebene der Metadaten: Welche geisteswissenschaftlichen Ressourcen beinhaltet ein Repositorium, wie sind diese
strukturiert und in welcher Relation stehen sie zueinander?
03
Technische Grundlagen
Das Semantic Web
The »Giant Global Graph« bzw. die »LOD Cloud«
Quelle: Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer,
Anja Jentzsch and Richard Cyganiak. https://lod-cloud.net/
Nachnutzungspotentiale
Semantische Verknüpfung und Analyse von Forschungsdaten
Nachnutzungsaspekte
LOD als Nachnutzungsbasis für Fachdaten
Fachdaten und/oder Metadaten zu diesen Fachdaten als LOD bereitzustellen ermöglicht
... es Dritten, meine digitalen Ressourcen zu finden.
... einen freien, strukturierten und maschinenlesbaren Zugriff (ggf. zu eigenen Analysezwecken).
... eine standardisierte Bereitstellung der Informationen nach W3C- und ISO-Standards.
... die Daten in einen größeren Kontext zu stellen und Datensilos somit aufzulösen.
Und zwar ohne Kontrollverlust über die eigenen Daten und deren Qualität!
Grundlagen
5-Star LOD
Vorschlag von Tim Berners-Lee: "The Semantic Web is an extension of the current web in which information
is given well-defined meaning, better enabling computers and people to work in cooperation" (Quelle)
Das "Five-Star" LOD Prinzip von Berners-Lee: (Quelle)
★ Stelle Daten im Web unter einer offenen Lizenz bereit. Das Format ist dabei egal
★★ Stelle Daten in einem strukturierten Format bereit
★★★ Verwende offene, nicht proprietäre Formate
★★★★ Verwende URIs um Dinge zu bezeichnen
★★★★★ Verlinke deine Daten mit anderen Daten um Kontexte herzustellen
Grundlagen
Technische Hintergründe
Das Semantic Web baut auf den existierenden Web-Standards (URIs, HTTP, HTML, u.a.) auf
Durch ein standardisiertes Datenmodell (RDF) und eine standardisierte Ontologie (OWL) wird es möglich,
implizite Informationen in und über (Web)Ressourcen zu explizieren, übergreifend miteinander zu verbinden und auch für eine maschinelle Auswertung verfügbar zu machen
RDF ist ein Datenmodell. Es legt nicht fest, in welcher Form es konkret serialisiert wird. Bis heute
haben sich zahlreiche Serialisierungsformate für RDF entwickelt (RDF/XML, Turtle, JSON-LD etc.)
Die Grundeinheit des Semantic Web bildet das Triple. Ein Triple stellt eine Aussage bestehend aus
einem Subjekt, einem Prädikat und einem Objekt dar.
Ein URI besteht nach RFC 3986 aus fünf Teilen:
scheme (Schema oder Protokoll), authority (Anbieter oder Server),
path (Pfad), query (Abfrage) und fragment (Teil).
Nur scheme, authority und path müssen in jedem URI vorkommen.
RDF legt nur ein gemeinsames Modell bzw. eine Syntax für den Datenaustausch fest.
Zur (maschinellen) Interpretation bzw. formalen Beschreibung der in RDF getroffenen
Aussagen werden Vokabulare benötigt. Nur dadurch wird eine maschinelle Auswertbarkeit
möglich.
RDF-Schema (RDFS) stellt ein Vokabular zur Verfügung, mit dem die in einer Fachdomäne vorkommenden
Begriffe und deren Eigenschaften und Relationen modelliert werden können. Mit RDFS lassen sich
einfache Ontologien realisieren.
Enthält ein Vokabular gleichzeitig auch Regeln für die richtige Verwendung der in ihm
definierten Begriffe spricht man von einer Ontologie.
Komplexe Ontologien benötigen eine formale Beschreibungssprache, die ausdrucksmächtiger ist als
RDF-Schema. Hierfür existiert die Web Ontology Language (OWL) des W3C.
Durch die Verwendung von OWL innerhalb einer Ontologie wird es möglich, logische Schlussfolgerungen
auf den Daten auszuführen, die mit dieser Ontologie arbeiten. Hierbei gilt die Open World Assumption:
Ein "Reasoner" nimmt an, dass etwas existiert, solange nicht explizit definiert wurde, dass es nicht existiert.