Your browser doesn't support the features required by impress.mod.js, so you are presented with a simplified version of this presentation.

For the best experience please use the latest Chrome, Safari or Firefox browser.

12.10.2016 | ISS | Mainz

Retro/Digitalisierung

Einblick in Theorie und Praxis

Vortrag im Rahmen der 1. Indian Summer School des Studiengangs “Digitale Methodik in den Geistes- und Kulturwissenschaften”, 10.–14.10.2016

H.-W. Bartz (ADWL Mainz) | M. Grüntgens (ADWL Mainz) | D. Kasper (ADWL Mainz)
Twitter digitale-akademie.de | Twitter @digicademy | Twitter digicademy | Docs@ISS

Released under CC BY 4.0 (Hans-Werner Bartz, Max Grüntgens, Dominik Kasper; Digitale Akademie)

Table of Contents

  1. Einführung
  2. Prämissen: Genauigkeit, Genauigkeit, Genauigkeit
    • Bildmaterial
    • Textmaterial
    • Use-Cases für Bild-, Text- und Mischdigitalisierung
  3. Konzeption und Durchführung
    • Planung des Digitalisierungs- und Projektworkflows
    • Verfahrensweisen
    • Beispiele aus der Praxis
  4. Lernressourcen, Literaturhinweise & Software

01

Einführung

Warum und wozu wird retrodigitalisiert?

  • Eine Strategie für die digitale (Online-)Bereitstellung gilt heute als Grundvoraussetzung bei der Beantragung/Verlängerung von geisteswissenschaftlichen Forschungsvorhaben
  • In vielen Fällen liegen bereits nur gedruckt erschienen Ergebnisse vor, deren digitale Grundstufe nicht (mehr) existiert oder veraltet ist
  • Bereitstellung von nur gedruckt vorliegenden (älteren) Werken für die digitale Weiterverarbeitung, bspw.
    • für Online-Präsentation
    • linguistische Korpusbildung
    • Digitale Langzeitarchivierung
    • ...

Definition

Als Retrodigitalisierung verstehen wir die Überführung analoger Text- und Bilddaten in ein elektronisches Format zum Zwecke der computergestützten Bereitstellung und Verarbeitung.

02

Prämissen

Bildmaterial

  • Abbildung der Materialität
    • Farbtreue durch Abgleich mittels Farbstreifen
    • Dokumentation der Proportionen durch Lineale
  • Zukunftssichere Datenformate, -qualität und -ablagemodalität
    • hohe Auflösung (300+ DPI)
    • verlustfreies Dateiformat (TIFF)
    • Originale und Arbeitskopien
  • Metadaten zu Identifikation und Erstellungs-Historie
    • Von Ersteller über Lagerort bis Material und Zustand
    • Standards
      • International Press Telecommunications Council Information Interchange Model (IPTC IIC)
      • IPTC Extensible Metadata Platform (XMP)
      • Dublin Core Metadata Initiative (DCMI) Metadata Terms

Textmaterial

  • Allgemeine Vorgaben
    • Vorlagengenauigkeit (99,998%)
    • Erhalt textspezifischer Strukturen (Beispiel: Poesie vs. Archivmaterial)
    • Sonderzeichen nach Unicode
    • Dateikodierung UTF-8
    • Reintextformate
  • Projektspezifische Vorgabe
    • Seiten- und Zeilengenauigkeit
    • Typographie und spezifische Sonderzeichen (Grad der Semi-Diplomatik)
    • Markierung von Entitäten (Personen, Orte, …)

Use-Cases

für Bild-, Text- und Misch-Digitalisierung

  1. Glasfenster, Bilderarchiv, Archivierung ohne Recherchebedarf
  2. Wissenschaftl. Publikation, Rechnungsbücher, statistisches Material
  3. Illuminierte Codices, wissenschaftl. Publikation mit Abb.

03

Konzeption und Durchführung

Planung des Digitalisierungs- und Projektworkflows

  1. im Haus: Hardwareaustattung (Bibliotheksscanner mit Buchwippe), Software, Arbeitsstunden, Expertise
  2. außer Haus: Rundum-sorglos-Paket (externe Anbieter), Expertise
  3. Mischform: Erfassung extern, Aufbereitung intern, Expertise
  • Expertise bedeutet …
    • … Übersicht über die Besonderheiten des Textes auf Zeichen-, Wort- und Formatierungsebene (Sonderzeichen, Stand der Orthographie bei Trennungen, Textanordnung).
    • … Hardwarekenntnisse (Scanner); Softwarekenntnisse (OCR-Programm, Tools für die Aufbereitung des OCR-Ergebnisses).

Verfahrensweisen

  • Double-Keying bzw. Triple-Keying
    • benötigt Personal zum Abtippen
    • Nachbearbeitung (Prüfen Diff) notwendig
  • Optical Character Recognition (OCR)
    • benötigt hochauflösende und präparierte Scans
    • benötigt spezialisierte Software
    • Muss angepasst (Sprache, Typographie) und “trainiert” werden
    • Problematisch bei Mischschriften (Antiqua+Fraktur) oder bei abweichenden Schriftschnitten

Beispiele aus der Praxis

  1. Goethes Biographica
  2. Schule von Salamanca
  3. Ein Werkzeug zur Bearbeitung und Qualitätskontrolle: TUSTEP

04

Lernressourcen, Literaturhinweise & Software

Literature

Präsentations-Software

Software zu Text-Aufbereitung (Auswahl)

Download