Retrodigitalisierung
Von Hans-Werner Bartz, Dominik Kasper und Max Grüntgens
Was heißt/ist Retrodigitalisierung?
- Hintergrund: Warum und wozu wird retrodigitalisiert?
- Hintergrund: Warum und wozu wird retrodigitalisiert?
- Def.: Als R. verstehen wir die Überführung analoger Text- und Bilddaten in ein elektronisches Format zum Zwecke der computergestützten Bereitstellung und Verarbeitung
- kurz Bild-, ausführlicher Textdigitalisierung
- Prämissen: Genauigkeit, Genauigkeit, Genauigkeit
- Images: Farbtreue, Dokumentation der Proportionen, hohe Auflösung (300+ DPI), Metadaten (von Lagerort bis Material und Zustand) / IPTC XMP / z.B. Dublin Core Standard / verlustfreies Dateiformat (TIFF)
- Text: Vorlagengenauigkeit (99,998 %), Seiten- und Zeilengenauigkeit nach Projektanforderung (Beispiel: Poesie vs. Archivmaterial), Typographie, Sonderzeichen nach Unicode / Dateikodierung UTF8
- DFG-Richtlinien verlinken
- Use-Cases für Bild-, Text- und Mischdigitalisierung
- Glasfenster, Bilderarchiv, Archivierung ohne Recherchebedarf
- wissenschaftl. Publikation, Rechnungsbücher, statistisches Material
- Illuminierte Codices, wissenschaftl. Publikation mit Abb.
- Konzeption und Durchführung
- Planung des Digitalisierungs- und Projektworkflows (abhängig von finanzieller und personeller Ausstattung)
- im Haus: Hardwareaustattung (Bibliotheksscanner mit Buchwippe), Software, Arbeitsstunden, Expertise
- außer Haus Rundum-sorglos-Paket (externe Anbieter)
- Mischform: Erfassung extern, Aufbereitung intern
- Verfahrensweisen: Double-Keying, OCR etc.
- Beispiele für Textvorlagen: Goethe vs. Salamanca
- Werkzeuge zur Bearbeitung und Qualitätskontrolle: TUSTEP
Eingesetzte Technologien und Fachbegriffe
Links zu Tutorien und Literaturhinweise
Allgemeines
- Susanne Kurz: Digital Humanities. Grundlagen und Technologien für die Praxis. Wiesbaden 2015. Kapitel: 7. Einführung in die Bildbearbeitung, S. 253–274.
- DFG-Praxisregeln “Digitalisierung”
OCR Workflow
Reguläre Ausdrücke