hoi Forum,
in der angehängten PDF-Datei ist typischer python doctest Text zu
sehen, also würde ich gerne diesen auf Korrektheit prüfen.
1 | $ python -m doctest -v comparator-Figs-05.pdf
|
...geht aber gar nicht. <Loriot "Ach...">
Den relevanten Text per Maus markieren, kopieren in eine ASCII-Datei
einfügen scheitert genauso wie den gesamten Text per pdftotext zu
extrahieren an mangelnder Umsetzungstreue bei mehrzeiligem Python Code
z.B. beim definieren von Funktionen.
(der Abstand zwischen Fortsetzungsprompt "... " und Folgecode wird per
Zeilenschaltung umgesetzt, anstelle der erwarteten Menge an Leerzeichen)
Ja, die Quelle ist (handgeschriebenes) HTML, der Code mit einem
einzigen pre -Block ausgezeichnet und die HTML-Datei lässt sich
natuerlich erfolgreich doctest-en (q.e.d.: Leerzeichen sind da wo sie
sein müssen).
Zum generieren der PDF-Datei wurde aus dem Webbrowser auf den
virtuellen Drucker "Print to File" gedruckt - visuell ist das Ergebnis
einwandfrei: man merkt aber beim selektieren mit der Maus dass an den
beanstandeten Stellen wohl keine Leerzeichen sind.
Es gilt nun vor dem Druck auf Papier (automagisch) zu überprüfen ob
doctest -mässig beim rendern v. HTML + umbetten in PDF nichts
kaputtgesetzt wurde.
Wer weiss mehr zum thema?
73 de Stephan HB9ocq