Forum: PC Hard- und Software Warum sind PDF-Dateien für Anleitungen so riesig?


von Walter T. (nicolas)


Lesenswert?

Hallo zusammen,

ich wollte ein paar alte Bedienungsanleitungen wegwerfen - schließlich 
gibt es ja viele davon als PDF vom Hersteller, und auf dem PC sind sie 
aufgrund der schieren Anzahl besser zu finden als im Aktenschrank.

Etliche Dateien sind allerdings riesig (12 MB für 2 Seiten 
schwarz-weiß):

https://meters.uni-trend.com/download/ut210d-user-manual/

Okay - an der Passermarken kann man erkennen, dass die Datei mal für die 
Druckvorstufe gedacht war. Aber was ist daran so riesig? Und kann man 
das mit Hausmitteln kleiner bekommen?

(Wenn ich die Papier-Version auf den Scanner lege, habe ich ca. 140 kB)

: Bearbeitet durch User
von H. H. (hhinz)


Lesenswert?

Walter T. schrieb:
> Etliche Dateien sind allerdings riesig (12 MB für 2 Seiten
> schwarz-weiß):

Wohl von Stümpern gescannt.

von Sebastian R. (sebastian_r569)


Lesenswert?

Walter T. schrieb:
> (Wenn ich die Papier-Version auf den Scanner lege, habe ich ca. 140 kB)

Als komprimierte Pixelgrafik mit begrenzter Auflösung

Walter T. schrieb:
> Aber was ist daran so riesig?

Die Schriftarten sind eingebettet und Grafiken sind Vektorgrafiken. 
Diese Datei ist im Prinzip der Druck-Master in entsprechender Qualität.

Walter T. schrieb:
> Und kann man
> das mit Hausmitteln kleiner bekommen?

Gibt Online- und Offline-Tools, um PDF-Dateien zu komprimieren. 
Empfehlungen kann ich dir allerdings nicht aussprechen.

H. H. schrieb:
> Wohl von Stümpern gescannt.

Gar nicht gescannt, sondern einfach unkomprimiert. Dadurch sind immerhin 
auch kleine Texte und Grafiken gut lesbar.

: Bearbeitet durch User
von Walter T. (nicolas)


Lesenswert?

Unwahrscheinlich. Das kommt irgendwo aus der Druckvorstufe.

Der Scan eines fertig geschnittenen Dokuments sähe anders aus.

von Dergute W. (derguteweka)


Lesenswert?

Moin,

evtl. mit Ghostscript - so ausm Kopp raus - muss nicht exakt stimmen:
1
gs -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=kleines.pdf grosses.pdf

Gruss
WK

von Frank D. (Firma: LAPD) (frank_s634)


Lesenswert?

Walter T. schrieb:
> Und kann man das mit Hausmitteln kleiner bekommen?

https://tools.pdf24.org/en/compress-pdf-v2

von H. H. (hhinz)


Lesenswert?

Walter T. schrieb:
> Unwahrscheinlich. Das kommt irgendwo aus der Druckvorstufe.
>
> Der Scan eines fertig geschnittenen Dokuments sähe anders aus.

Dann haben die wohl das dort übliche TIFF einfach ins PDF eingedost.

von Oliver S. (oliverso)


Lesenswert?

Sebastian R. schrieb:
> Die Schriftarten sind eingebettet und Grafiken sind Vektorgrafiken.
> Diese Datei ist im Prinzip der Druck-Master in entsprechender Qualität.

Und warum soll daß dann 12MB ergeben?

Solch riesige Dateien gibt eigentlich nur, wenn das im pdf einfach 
eingebettet gescannte Images von Papieroriginalen sind. Nix Vector, 
keine Schriften, keine Texte, nur ein TIFF o.ä.

Oliver

von Sebastian R. (sebastian_r569)


Lesenswert?

Oliver S. schrieb:
> Solch riesige Dateien gibt eigentlich nur, wenn das im pdf einfach
> eingebettet gescannte Images von Papieroriginalen sind. Nix Vector,
> keine Schriften, keine Texte, nur ein TIFF o.ä.

Es sind keine Images. Das Dokument ist frei verfügbar. Du darfst gerne 
deine forensische Analyse dazu vorstellen.

von Ein T. (ein_typ)


Lesenswert?

Walter T. schrieb:
> Okay - an der Passermarken kann man erkennen, dass die Datei mal für die
> Druckvorstufe gedacht war. Aber was ist daran so riesig?

Die Pixelgrafiken in Deinem PDF: Diagramme, Logos, Fotografien und so 
weiter. Monitore haben üblicherweise zwischen 72 und 100 dpi (dots per 
inch), in der Druckvorstufe sind 300 dpi üblich. Bei einer 
sechzehnfachen Menge an Rohdaten hilft auch die beste Komprimierung 
leider nur teilweise.

von Walter T. (nicolas)


Lesenswert?

Walter T. schrieb:
> Unwahrscheinlich. Das kommt irgendwo aus der Druckvorstufe.
> Der Scan eines fertig geschnittenen Dokuments sähe anders aus.

Die Antwort bezog sich natürlich auf eine Antwort davor, von Hinz.


Es geht sogar noch extremer.

Bedienungsanleitung für ein Fotostativ mit 113 MB.

https://downloads.rollei.com/download/stativ-c5i/

Selbst wenn für jede Seite alle Schriftsätze und Farbtabellen 
eingebettet wären, würde das nicht die Größe erklären.

von René H. (mumpel)


Lesenswert?

Mit Adobe Acrobat z.B. kann man die Größe reduzieren. Dann schrumpfen 
sie gewaltig. Ob das PDF24 auch kann habe ich noch nicht getestet.

von Walter T. (nicolas)


Lesenswert?

Adobe Acrobat 9 habe ich schon probiert.

Mit "gescannte Datei optimieren" wird alles grob gerastert, mit 
"Dateigröße verringern" wird das Dokument sogar größer.

In die PDF-Container wird irgendetwas eingebettet sein, was die Größe 
erklärt. Das zu finden fehlt mir aber Werkzeug und Know-How.

Bei PDF24 kommt übrigens ungefähr die gleiche Größe heraus, wie wenn man 
im Abcrobat auf einem PDF-Drucker ausdruckt.

: Bearbeitet durch User
von H. H. (hhinz)


Lesenswert?

Sebastian R. schrieb:
> Das Dokument ist frei verfügbar. Du darfst gerne
> deine forensische Analyse dazu vorstellen.

Enthält TIFF mit 2400dpi, und wurde von der Corel PDF Engine Ver. 14 
verpackt.

Stümper halt.

: Bearbeitet durch User
von Hans W. (Firma: Wilhelm.Consulting) (hans-)


Lesenswert?

Dergute W. schrieb:
> Moin,
>
> evtl. mit Ghostscript - so ausm Kopp raus - muss nicht exakt stimmen:
>
>
1
gs -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=kleines.pdf 
2
> grosses.pdf
>
> Gruss
> WK

Das wäre mein script:
1
#!/bin/bash
2
3
gs -q -dNOPAUSE -dBATCH -dSAFER -sDEVICE=pdfwrite -dCompatibilityLevel=1.7 -dPDFSETTINGS=/prepress -dEmbedAllFonts=true -dSubsetFonts=true -dColorImageDownsampleType=/Bicubic -dColorImageResolution=300 -dGrayImageDownsampleType=/Bicubic -dGrayImageResolution=300 -dMonoImageDownsampleType=/Bicubic -dMonoImageResolution=300 -sOutputFile="${1%.*}.compressed.pdf" "$1";

die 300dpi sind gewollt recht hoch... gerade bei /prepress könnte man 
weiter sparen. damit kommen aber schöne PDFs raus die eine erträgliche 
größe haben.

Update... von 11,9MB wirds damit 3,7MB Groß... da ginge sicher noch viel 
mehr - mit dem preset ist das aber selbst beim zoom am pc noch scharf... 
und das ist mir bei dem script wichtig.

73

: Bearbeitet durch User
von Udo K. (udok)


Lesenswert?

Walter T. schrieb:
> Adobe Acrobat 9 habe ich schon probiert.
>
> Mit "gescannte Datei optimieren" wird alles grob gerastert, mit
> "Dateigröße verringern" wird das Dokument sogar größer.

Mit Acrobat PDF Drucker in ein File drucken - schwarzweiss und 150 DPI 
einstellen - reduziert die Grösse auf 2.2 MB.

von Walter T. (nicolas)


Lesenswert?

Sieh an. Es sind keine Schriften eingebettet. Es sind viele, viele 
Kurven.

Ein Bitmap ist auch eingebettet. Mal sehen, ob ich das isoliert bekomme.

Ich korrigiere: Es ist Arial eingebettet. Wird aber nur für die 
Kopfzeile genutzt.

Das ganze Ding ist eine sehr feine Vektorgrafik.

: Bearbeitet durch User
von Georg M. (g_m)


Lesenswert?


von Walter T. (nicolas)


Lesenswert?

Danke, das hatte ich schon gefunden. Es geht mir mehr um die 
Problemursache als um die Anleitung selbst.

Wie ich ja schon im Eröffnungsbeitrag schrieb: Die Anleitung habe ich 
jetzt einfach gescannt und mit 140 kB achiviert.

von Oliver S. (oliverso)


Lesenswert?

Walter T. schrieb:
> s sind keine Schriften eingebettet.

Doch. Eine. Für die Seitenheader

P/N: 110401105246X
MAY.2018 REV. 1

Das ist auch der gesamte Text, der in dem pdf steckt. Dazu dann noch 9 
kleine png-Images mit in paar kB.

Der ganze Rest sind Images, die im Background stecken.

Oliver

von Zino (zinn)


Lesenswert?

Walter T. schrieb:
> Etliche Dateien sind allerdings riesig (12 MB für 2 Seiten
> schwarz-weiß):

Schrecklich, das sind ja 9 Disketten! Oder heutzutage ungefähr 0,0000004 
Festplatten.

von Zino (zinn)


Lesenswert?

H. H. schrieb:
> Enthält TIFF mit 2400dpi, und wurde von der Corel PDF Engine Ver. 14
> verpackt.

Das größte Pixel-Bild hat 56x32 Pixel. Das macht den Helmut nicht fett.

von Zino (zinn)


Lesenswert?

> Sieh an. Es sind keine Schriften eingebettet.

Doch. ArialMT ohne Subsetting. Komprimiert 19384 Bytes.

Es ist auch noch ein ICC-Profil mit komprimiert 225508 Bytes drin.

von Zino (zinn)


Lesenswert?

Ein T. schrieb:
> Die Pixelgrafiken in Deinem PDF: Diagramme, Logos, Fotografien und so
> weiter. Monitore haben üblicherweise zwischen 72 und 100 dpi (dots per
> inch), in der Druckvorstufe sind 300 dpi üblich. Bei einer
> sechzehnfachen Menge an Rohdaten hilft auch die beste Komprimierung
> leider nur teilweise.

Die Größe von mit geeignetem Verfahren komprimierten (echten) Bilder 
wächst etwa linear mit der Auflösung, nicht quadratisch.

von Zino (zinn)


Lesenswert?

Und dann sind da auch noch private Daten von Adobe Illustrator 
(page-piece dictionaries) drin. Bin zu faul, das aufzusummieren.

von Walter T. (nicolas)


Lesenswert?

Wie liest Du das aus? Gibt es Werkzeuge, um PDF-Dateien als die 
Container zu betrachten, die sie sind?

von Zino (zinn)


Lesenswert?

Werkzeug: gibt es, z.B. https://docs.apryse.com/cli/guides/pdf-cosedit 
(das habe ich seit vielen Jahren nicht mehr verwendet, keine Ahnung, was 
daraus geworden ist).

Zum "Warum so riesig": Vermutlich wurde das Dokument von Papier gescannt 
und dann mit Adobe Illustrator in Vektorgrafik verwandelt.

von Benedikt L. (Firma: Dem Ben seine Leiche) (dembenseineleiche) Flattr this


Lesenswert?

Nehmt doch dies Werkzeug:

https://bentopdf.bpsnttapp.com/index.html

Alles im Browser.

von Ein T. (ein_typ)


Lesenswert?

Zino schrieb:
> Ein T. schrieb:
>> [...] Bei einer sechzehnfachen Menge an Rohdaten [...]
>
> Die Größe von mit geeignetem Verfahren komprimierten (echten) Bilder
> wächst etwa linear mit der Auflösung, nicht quadratisch.

ROHDATEN, Superhirn.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.