Projektziele

Ein wesentliches Hauptziel von OCR-D ist die konzeptionelle Vorbereitung der Transformation der VD-Drucke (16.-19. Jh.) in maschinenlesbare Form.

Um dies zu erreichen werden angestrebt:

  • die Erstellung von Referenzkorpora
  • die Erarbeitung von Standards hinsichtlich Metadaten
  • die Weiterentwicklung der Optical Layout Recognition (OLR)
  • die Analyse vorhandener Tools, auch zur Nachkorrektur (z.B. mittels Crowdsourcing)
  • die Erstellung eines Workflows
  • die Erstellung von Verfahren der Qualitätssicherung

Am Ende des Gesamtvorhabens soll ein konsolidiertes Verfahren zur OCR-Verarbeitung von Digitalisaten des gedruckten deutschen Kulturerbes des 16. bis 19. Jh. erarbeitet sein, das Antworten auf technische, informationswissenschaftliche und organisatorische Fragen liefert.