Dienstag, 8. Juli 2014

OCR und Fußnoten

Der Fortschritt ist eine Schnecke, sagt Grass. Das gilt auch für das Technische. Ich probiere mit Abbyy Finereader 12 aus, ob es einen Fortschritt mit den Fußnoten gibt. Eine Testversion über CHIP heruntergeladen. Quälend lange Installation. Nun ja, man kann währendessen weiterarbeiten ...

Eine Seite aus einem eigenen Buch, IBM-Schreibmaschine, im Offset-Verfahren erschienen. Jede Menge Fußnoten.

Im werblichen Teil des Angebots heißt es:

Verbessert! ABBYY ADRT® analysiert und verarbeitet ein mehrseitiges Dokument als eine Einheit und nicht als einzelne und unabhängige Seiten, um die Struktur des Originals beizubehalten. Dies ermöglicht die Wiederherstellung von Formatierungen wie:
  • Hierarchiestruktur von Überschriften
  • Inhaltsverzeichnis
  • Kopf- und Fußzeilen
  • Vertikale Kopfzeilen
  • Seitennummerierung
  • Fußnoten
  • Schriftarten und Schriftstile
  • Beschriftungen für Bilder/ Tabellen/ Diagramme
  • Logischer Textfluss
  • Randbemerkungen
Das bedeutet jetzt, dass die Fußnote unten stehen, der Text ist gut erkannt. Das war aber auch schon in der Version 8 so. Nur eben -- die Zuordnung von Fußnotenziffer im Text zur jeweiligen Fußnote, die gibt es nicht. Das ist eine blöde Arbeit dann: Fußnote setzen, Text ausschneiden, einkopieren. Nächste ... Hört sich einfach an, ist aber verdammt zeitraubend. Das genau hätte ich mir gerne gespart.

--

Nachtrag: Ich habe nach Abbyy-FR-Anleitung die Sache mit einer Musterseite mit vier Fußnoten ausprobiert. Die Verlinkung der Fußnoten in den Text hinein hat nicht geklappt.