Retrodigitalisierung

Von Hans-Werner Bartz, Dominik Kasper und Max Grüntgens

Was heißt/ist Retrodigitalisierung?

  • Hintergrund: Warum und wozu wird retrodigitalisiert?
    • Hintergrund: Warum und wozu wird retrodigitalisiert?
    • Def.: Als R. verstehen wir die Überführung analoger Text- und Bilddaten in ein elektronisches Format zum Zwecke der computergestützten Bereitstellung und Verarbeitung
  • kurz Bild-, ausführlicher Textdigitalisierung
  • Prämissen: Genauigkeit, Genauigkeit, Genauigkeit
    • Images: Farbtreue, Dokumentation der Proportionen, hohe Auflösung (300+ DPI), Metadaten (von Lagerort bis Material und Zustand) / IPTC XMP / z.B. Dublin Core Standard / verlustfreies Dateiformat (TIFF)
    • Text: Vorlagengenauigkeit (99,998 %), Seiten- und Zeilengenauigkeit nach Projektanforderung (Beispiel: Poesie vs. Archivmaterial), Typographie, Sonderzeichen nach Unicode / Dateikodierung UTF8
    • DFG-Richtlinien verlinken
  • Use-Cases für Bild-, Text- und Mischdigitalisierung
    • Glasfenster, Bilderarchiv, Archivierung ohne Recherchebedarf
    • wissenschaftl. Publikation, Rechnungsbücher, statistisches Material
    • Illuminierte Codices, wissenschaftl. Publikation mit Abb.
  • Konzeption und Durchführung
    • Planung des Digitalisierungs- und Projektworkflows (abhängig von finanzieller und personeller Ausstattung)
    1. im Haus: Hardwareaustattung (Bibliotheksscanner mit Buchwippe), Software, Arbeitsstunden, Expertise
    2. außer Haus Rundum-sorglos-Paket (externe Anbieter)
    3. Mischform: Erfassung extern, Aufbereitung intern
  • Verfahrensweisen: Double-Keying, OCR etc.
  • Beispiele für Textvorlagen: Goethe vs. Salamanca
  • Werkzeuge zur Bearbeitung und Qualitätskontrolle: TUSTEP

Eingesetzte Technologien und Fachbegriffe

Allgemeines

  • Susanne Kurz: Digital Humanities. Grundlagen und Technologien für die Praxis. Wiesbaden 2015. Kapitel: 7. Einführung in die Bildbearbeitung, S. 253–274.
  • DFG-Praxisregeln “Digitalisierung”

OCR Workflow

Reguläre Ausdrücke