Office-Blog

PDF-Dateien in Word 2013 öffnen: Das ergab ein Test

16.03.2013   TEAM

Eine der spektakulären Neuerungen in Word 2013 ist die Fähigkeit, PDF-Dokumente zu öffnen und zu bearbeiten. Damit entfällt eine bisherige Fehlerquelle durch vorgeschaltete Konvertierungsprogramme.

Natürlich habe ich das gleich ausprobiert. Das Ergebnis ist überzeugend, auch wenn ohne Nachbearbeitung keine wirklich befriedigende Gestaltung zu erzielen ist.

Das ist aber nicht Word anzulasten, sondern dem PDF-Format, das rahmenorientiert arbeitet. Daher erhalten in PDF-Dateien – auch wenn sie aus Word heraus erzeugt werden – manche Objekte eigene Rahmen. Das wird beim (Re-)Import nicht automatisch repariert. Auch die Zuordnung zu Formatvorlagen funktioniert nicht fehlerfrei.

Neben den in der dritten Abbildung markierten Fehlern wurde bei diesem Test auch noch die Seite falsch umbrochen und Kopf- und Fußzeilen nicht erkannt.

Bei dem gezeigten Beispiel handelt es sich um eine vergleichsweise leicht zu interpretierende PDF-Datei, denn ich habe sie mit dem Word-eigenen PDF-Export erzeugt. Bei mit anderen Programmen erzeugten oder gar mit OCR lesbar gemachten PDF-Dokumenten fallen die Format-Fehlinterpretationen noch heftiger aus.

Das Beispiel

Hier zunächst der Ausgangstext in einem Word-Dokument:

Das Original-Dokument in Word 2013

Nach dem Export als PDF

Hier das Resultat, nachdem das Dokument in Word als PDF exportiert wurde – mit Rahmenmarkierung:

Nach dem Speichern in Word als PDF

Nach dem Reimport in Word 2013

Hier eine Liste der Fehler und Ungenauigkeiten:

Nach dem Reimport der PDF in Word 2013

 

Und wie ist es bei eingescannten PDF-Dateien?

Ein weit verbreiteter Irrtum ist die Annahme, in einem als PDF gescannten Textdokument wäre der Text bearbeitbar. Das Scannen liefert eine Pixelgrafik. Demzufolge ist die so erzeugte PDF-Datei eine mit eingebetteten Pixelgrafiken.

Erst eine OCR-Behandlung kann daraus einen mehr oder minder bearbeitbaren Text erstellen. Auch wenn das folgende Dialogfeld von Word 2013 beim Öffnen einer PDF es anders suggeriert: Word kann (noch) kein OCR, auch ein mit Word geöffneter PDF-Scan bleibt eine Grafik.

PDF_in_Word_2013_4

 

Über den Autor

TEAM