Version 1.2

workshop: PDF-KungFoo mit Ghostscript & Co.

Mini-Trainingslager für künftige Champions

Mrmcd15-pdfkungfoo-logo

Dieses Mini-Trainingslager erfordert keinerlei körperlichen Vorbereitungen für die Teilnehmenden. Es ist auch nicht unbedingt ein "Mitmach"-Event. In jedem Fall aber ist es eine "Aufpaß"-Veranstaltung, die ein Minimum geistiger Fitness erfordert.

Teilnehmer erhalten (in Abstimmung mit der Wettkampfleitung) exklusiven Zugriff auf einen kollektiven MRMCD15-Trainingsplan. Dieser Plan besteht aus schriftlich niedergelegten Ertüchtigungs-Übungen, mehreren Beispiel-Dateien, einem Makefile sowie ggf. aus einer Aufzeichnung ausgewählter Vorgänge des Trainingslagers. Die Aufzeichnung kann zur späteren detaillierten Video-Analyse der gesehenen Vorführungen dienen.

Der Trainingsplan garantiert Teilnehmern (sogar bei nur lockerer Befolgung) den Weg zu schnellen persönlichen Erfolgen in der Auseinandersetzung mit störrischen PDFs. Bereits nach einer Woche täglichen 30-Minuten-Trainings sieht die PDF-Welt ganz anders aus. Garantiert!

Das Trainingslager setzt sich aus mehreren Übungs-Einheiten zusammen. Jede Einheit wird circa 30 bis 45 Minuten in Anspruch nehmen.

Erste Übungs-Einheit: Wir schreiben eine PDF im Text-Editor

Der Übungs-Leiter wird live demonstrieren, wie man eine einfache PDF mit einem Text-Editor schreibt. Er fängt mit einer leeren Datei an, und wird am Ende eine zwei-seitige PDF, bestehend aus ca. 2000 Bytes lesbaren PDF-Codes vorweisen können.

Vermutlich wird er zum Editieren VIm verwenden.

Unterwegs wird er nebenher einige wichtige Hinweise zur Bedienung von VIm geben, z.B.:


  • VIm unbedingt im Binär-Modus starten -- vim -b -- und warum dies wichtig ist.

  • Mittels :goto 4321 zu Byte-Position 4321 innerhalb der Datei springen.

Während des Schreib- und Editier-Vorgangs wird er zugleich diverse Konzepte der PDF-Struktur erläutern und in die grundlegendsten Elemente der PDF-Syntax einführen.

Zuletzt kommen auch noch diverse PDF-Viewer und auch PDF-Kommandozeilen-Tools zu Ehren, die bei der Überprüfung und Validierung der geschriebenen PDF-Syntax behilflich sind.

Zweite Übungs-Einheit: Zirkel-Training mit diversen (erlaubten) Hilfmitteln

Einige der folgenden Werkzeuge hatten bereits bei der ersten Übungs-Einheit einen Kurz-Auftritt. Falls nicht, treten sie spätestens jetzt in Erscheinung:


  • pdfinfo,

  • pdffonts,

  • pdfimages,

  • pdfresurrect,

  • pdfattach,

  • pdftotext,

  • pdfid.py,

  • pdf-parser.py,

  • peepdf.py,

  • Ghostscript,

  • qpdf,

  • mupdf,

  • mutool...

Als Trainings-Material dienen u.a. auch diverse auf GitHub hinterlegte, handgeschriebene PDF-Dateien.

Dritte Übungs-Einheit: PDF-Manipulationen "am offenen Herzen"

Das endgültige Programm dieser Einheit steht noch nicht fest. In Frage kommen jedoch die folgenden Disziplinen:


  • Unsichtbare Schriften sichtbar machen.

  • Frühere Versionen einer PDF wieder herstellen.

  • Aus einer bestehenden PDF enthaltene Schriften als valide Font-Dateien extrahieren.

  • Eine Farb-PDF in eine Graustufen-PDF konvertieren.

  • Aus einer PDF alle Bilder entfernen.

  • Den PDF-Quellcode eines beliebigen Dokuments aus einer "unleserlichen" in eine les- und editierbare Form überführen.