Forum: PC Hard- und Software Warum sind PDFs so groß?


von Manfred (Gast)


Lesenswert?

Wenn ich 6 PNGs via LibreOffice (Writer bzw. Draw) zu einem PDF 
zusammenfüge, dann vergrößert sich die Datenmenge von 0,9 MBytes auf 2,9 
MBytes.

Sind andere PDF-Programme besser, was die Dateigröße angeht? Gibt es 
einen Kniff, um die Größe des PDFs zu reduzieren? Das generierte PDF zu 
zipppen, bringt keine wesentliche Verbesserung.

von Pete K. (pete77)


Lesenswert?

Schau mal hier: https://tools.pdf24.org/de/
PDF-verkleinern

von Erwin D. (Gast)


Lesenswert?

Manfred schrieb:
> Wenn ich 6 PNGs via LibreOffice (Writer bzw. Draw) zu einem PDF
> zusammenfüge, dann vergrößert sich die Datenmenge von 0,9 MBytes auf 2,9
> MBytes.
>
> Sind andere PDF-Programme besser, was die Dateigröße angeht? Gibt es
> einen Kniff, um die Größe des PDFs zu reduzieren? Das generierte PDF zu
> zipppen, bringt keine wesentliche Verbesserung.

Du kannst im LibreOffice in den PDF-Optionen die Qualität und die 
Auflösung einstellen.

von Udo S. (urschmitt)


Lesenswert?

Wahrscheinlich legt LibreOffice da noch einen Rattenschwanz an 
Zeichensätzen etc ab.
Ausserdem hängt es davon ab mit welcher Kompressionsart die Grafik im 
PDF gespeichert wird.
PDF ist kein Bildformat, sondern ein Textsatzsystem. Images sind da nur 
mehr oder weniger gut eingebettete Binärobjekte.

von Dr. MCU (Gast)


Lesenswert?

Udo S. schrieb:
> Wahrscheinlich legt LibreOffice da noch einen Rattenschwanz an
> Zeichensätzen etc ab.
> Ausserdem hängt es davon ab mit welcher Kompressionsart die Grafik im
> PDF gespeichert wird.
> PDF ist kein Bildformat, sondern ein Textsatzsystem. Images sind da nur
> mehr oder weniger gut eingebettete Binärobjekte.

Blödsinn. PDF ist ein Dokumentenformat. Daher der Name: Portable 
Document Format.

von Karl (Gast)


Lesenswert?

Evtl. werden die png in jpg umgewandelt und so im pdf gespeichert?

von Dymo Fond (Gast)


Lesenswert?

Bei der PDF-Generierung wird jedes PNG ausgepackt und die rohen Bits für 
das jeweilige Bild in das PDF gebacken. Beschwerden darüber sind an 
Adobe zu richten.

von Udo S. (urschmitt)


Lesenswert?

Dr. MCU schrieb:
> Blödsinn. PDF ist ein Dokumentenformat. Daher der Name: Portable
> Document Format.

Ja war nicht korrekt ausgedrückt. Es ist ein Dokumentenformat. Die Daten 
darin werden aber gespeichert wie bei einem Textsatzsystem. Einzelne 
Strings oder gar nur einzelne Zeichen werden mit einer Position relativ 
zur Seitenecke abgelegt.
Das ist auch der Grund warum es je nach PDF schwierig sein kann den Text 
als Text zu extrahieren oder auch nur mit Copy/paste zu arbeiten.

von JE (Gast)


Lesenswert?

PDF unterstützt nur relativ wenige Bildformate direkt einbetten. PNG ist 
erstmal nicht dabei.
Ggf. konvertiert deine Software die Bilder in Bitmaps und fügt diese 
dann in das PDF ein. Du kannst mal versuchen die Bilder als jpg 
einzubetten; das wird nativ unterstüzt.

Eventuell sind deine Bilder aber auch riesig groß - dann ist das kein 
Wunder.

Beitrag #6657546 wurde von einem Moderator gelöscht.
von Sebastian L. (sebastian_l72)


Lesenswert?

Manfred schrieb:
> Wenn ich 6 PNGs ...zu einem PDF zusammenfüge

PDF ist eine vektorbasierte Seitenbeschreibungssprache.
Welche version von PDF generierst du?
Sind das vektorbasierte PNG, Bitmaps oder Hybride.
PNG bitmap wird von PDF nicht überstützt und es werden je nach Version 
von PDF, bitmaps erzeugt. Wenn man die Auflösung deiner PDF-Bitmaps dann 
hochgeschraubt hast, werden da zwischenpixel erreichnet.

Passe die Einstellungen des PDF Destillers den Anwendungszweck 
(Bildschirmdarstellung, Druck und wenn ja welcher) an.

Nein, Druckvorstufe war noch nie leicht. Lynotypes waren aber noch 
unpraktischer.

von Editor (Gast)


Lesenswert?

Nimm LaTeX und ersetze die PNGs durch Vektorgraphiken mit tikz, wenn du 
kleine PDFs haben möchtest.

von Erwin D. (Gast)


Lesenswert?

Sebastian L. schrieb:
> Einstellungen des PDF Destillers

Er arbeitet nicht mit dem Distiller, sondern erzeugt die PDFs mit 
LibreOffice. Das kann selbst aus den Office-Dokumenten PDFs erzeugen. 
Aus diesem Grunde hatte ich schon weiter oben geschrieben, daß er in den 
PDF-Optionen von LibreOffice die Qualität und die Auflösung einstellen 
kann. Damit werden die entstehenden PDFs beliebig klein (natürlich dann 
auf Kosten der Qualität).

von xyz (Gast)


Lesenswert?

> Damit werden die entstehenden PDFs beliebig klein (natürlich dann
> auf Kosten der Qualität).

Selbst aus den Buchverlagen kommt heute so ein typografischer Dreck.
Weil der Autor entweder zu dumm, zu faul oder sonstige geistige
Maengel hat, werden selbst Texttabellen als matschige Grafik in
ein PDF geklatscht. Und bei der Masse wird das auch nicht "klein".

Protipp: Mach aus deinen Grafiken Vektorobjekte.
Ausser, es sind wirklich Fotos.
Ob Libreoffice den echten Import von Vektorobjekten kann,
musst du dann selber herausfinden.
MS-Software tut zwar so, als wenn sie es koennte, wandelt
sie aber klammheimlich in Grafiken um. Damit ist dann nichts
gewonnen...

von Programmierer (Gast)


Lesenswert?

https://gitlab.mister-muffin.de/josch/img2pdf

Zitat:

Lossless conversion of raster images to PDF. You should use img2pdf if 
your priorities are (in this order):

- always lossless: the image embedded in the PDF will always have the 
exact same color information for every pixel as the input
- small: if possible, the difference in filesize between the input image 
and the output PDF will only be the overhead of the PDF container itself
- fast: if possible, the input image is just pasted into the PDF 
document as-is without any CPU hungry re-encoding of the pixel data

Conventional conversion software (like ImageMagick) would either:

- not be lossless because lossy re-encoding to JPEG
- not be small because using wasteful flate encoding of raw pixel data
- not be fast because input data gets re-encoded

von Erwin D. (Gast)


Angehängte Dateien:

Lesenswert?

Programmierer schrieb:
> Lossless conversion of raster images to PDF.

von Programmierer (Gast)


Lesenswert?

xyz schrieb:
> Selbst aus den Buchverlagen kommt heute so ein typografischer Dreck.
> Weil der Autor entweder zu dumm, zu faul oder sonstige geistige
> Maengel hat

Besonders witzig bei wissenschaftlichen Papern:
1. Ein Forscher verfasst ein grundlegendes Paper das z.B. einen 
brandneuen Algorithmus einführt, und fügt sorgfältig erstellte 
hochqualitative Vektor-Grafiken ein.
2. Der nächste Forscher will eine Verbesserung des Algorithmus 
veröffentlichen, macht einen Screenshot von der Grafik (als PNG) und 
fügt sie in sein eigenes Paper ein und zitiert das Original. Jetzt ist 
es keine Vektorgrafik mehr und wird pixlig/unscharf wenn der Zoom des 
PDF-Viewers nicht exakt dem Zoom entspricht, mit dem der Screenshot 
gemacht wurde.
3. Schritt 2 wiederholt sich bei weiteren zitierenden Papern, wobei die 
Grafik immer wieder gescreenshottet und kopiert wird und sukzessive 
immer schlechtere Qualität bekommt.

Wenn man sich an der Zitationsfolge bis zum Ursprungs-Paper entlang 
hangelt, kann man sehen wie die Qualität besser wird. Das Ganze 
natürlich auch in der Informatik, wo "Vektorgrafik" ein Begriff sein 
sollte.

Der Implementation im Anhang ist wahrscheinlich auch eine Katastrophe 
(falls nicht sowieso weggelassen weil keine reproduzierbaren Ergebnisse) 
aber Hauptsache wieder was veröffentlicht!

Erwin D. schrieb:
> Programmierer schrieb:
>> Lossless conversion of raster images to PDF.

Wo stammt das her? Sicher dass das nicht vergrößernd neu kodiert? Denn 
die Antwort auf die Ausgangsfrage ist: PDFs mit Bildern sind nur minimal 
größer als die Bilder selbst, wenn der Konverter nicht 
ungeschickterweise neu kodiert.

von Erwin D. (Gast)


Lesenswert?

Programmierer schrieb:
> Wo stammt das her?

Das hab ich nun schon mehrfach geschrieben. Ausserdem steht's in der 
Titelleiste des Fensters. Aber ich schreibe es gern nochmal.
Es sind die PDF-Optionen von LibreOffice.

von Georg (Gast)


Lesenswert?

Programmierer schrieb:
> - small: if possible, the difference in filesize between the input image
> and the output PDF will only be the overhead of the PDF container itself

Small bedeutet, wenn man es richtig liest: die Daten werden nicht viel 
grösser - kleiner werden sie aber auf keinen Fall.

Georg

von Manfred (Gast)


Lesenswert?

Vielen Dank für eure vielfältigen Antworten.

Komme jetzt gut klar:

150 DPI, lossless, 40 % kleinere Datei
150 DPI, JPEG (90 %), 65 % kleine Datei

Die Images sind nach wie vor sehr gut zu erkennen.

Noch einmal vielen Dank :)

von DalliDalli (Gast)


Lesenswert?

Manfred schrieb:
> Wenn ich 6 PNGs via LibreOffice (Writer bzw. Draw) zu einem PDF
> zusammenfüge, dann vergrößert sich die Datenmenge von 0,9 MBytes auf 2,9
> MBytes.

Stell die dpi kleiner, dann wird auch das pdf kleiner

von oszi40 (Gast)


Lesenswert?

Wie schon oben geschrieben gibt es einige "Stellschrauben"
-dpi
-exotische Schriften (müssen mitgeliefert werden)
-Schrift als Bild macht aus wenigen Buchstaben eine große Datei
-Bildkomprimierungsfaktor

von Georg (Gast)


Lesenswert?

Man kann sicher schlanke PDFs erzeugen, wenn die (Vektor) Grafikdaten 
als Postscript vorliegen. Aber vermutlich nicht mit Libreoffice.

Vektorgrafiken als Pixeldaten zu speichern ist selten eine befriedigende 
Lösung, wenn die Qualität gut sein soll muss man halt die Grösse in Kauf 
nehmen.

Georg

Beitrag #6658686 wurde von einem Moderator gelöscht.
von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Sebastian L. schrieb:
> Manfred schrieb:
>> Wenn ich 6 PNGs ...zu einem PDF zusammenfüge
>
> PDF ist eine vektorbasierte Seitenbeschreibungssprache.

Nö.

PDF ist ein objektorientiertes Containerformat.

Darin können "Textobjekte", "Pfadobjekte" (Vektor), "Bildobjekte" 
(Pixel) u.v.a. bis hin zu 3D-Grafiken, Video, Audio oder gar 
Programmcode (Javascript) enthalten sein, nebst Strukturobjekten wie 
Verzeichnisse oder Signaturen.

Daneben gibts noch "Unter"-Standards wie PDF-X (fürs Druckgewerbe), 
PDF-A (zum Langzeit-Archivieren), "ZUGFERD" für die elektronische 
Rechnungslegung (mit eingebettetem XML) oder PDF-Formulare usw.

Das ist echt ein seeehr weites Feld ...

von xyz (Gast)


Lesenswert?

> PDF ist ein objektorientiertes Containerformat.

PDF ist auf dem besten Weg, sich wie Flash selber zu zerlegen.
Adobe Lifecyclemanagement arbeitet fleissig daran!

> PDF ist eine vektorbasierte Seitenbeschreibungssprache.

Dabei haetten sie mal bleiben sollen. Mit einigen thematisch
passenden Erweiterungen wie Bildformate und auch gerne
Signaturen. Auch bei den gewerblichen Anwendern hat eine
gewisse Rueckbesinnung stattgefunden und statt der
"allerletzen und ganz bestimmt allerbesten" PDF-Version
finden sich wieder PDFV1.4 und PDFV1.5.

Neulich ein "PDF" einer Zeitschrift gesehen, dass hatte einen
scheinbar in JS geschriebenen "Viewer" mit dem in dem Heft
geblaetter werden "koennen" sollte.
Nach einer Minute habe ich das abgebrochen.
Es war schlicht unsaeglich laaaaangsam und natuerlich war
auch der restliche Komfort wie Zoom und Textsuche
dabei hinueber gegangen.

Aktuelle Software aus dem Hause Adobe schafft es nicht mehr,
von einem Architekten gelieferte Grundrissplaene mit einigen
Layern mehr, auszudrucken. Das bricht einfach nach einigen
Minuten sang- und klanglos ab.
Von der miserablen Geschwindigkeit mir der sie sich bedienen
und benutzen laesst mal ganz abgesehen.

von Andreas (Gast)


Lesenswert?

PDF kann zwar PNG nicht direkt einbetten, unterstützt aber verlustfreie 
Codierungsmethoden die praktisch genauso effizient sind (Prädiktion + 
Entropiecodierung). Wenn also das PDF vielfach größer ist als die 
ursprünglichen PNG-Dateien, dann nutzt der PDF-Generator die vorhandenen 
Möglichkeiten einfach nicht gut aus. Einer der das tut ist pdflatex; 
wenn du da ein PNG einbindest erwarte ich dass das resultierende PDF 
nicht viel größer ist. Allerdings hätte ich das Openoffice eigentlich 
auch zugetraut.

Ein anderer häufiger Grund warum ein PDF größer wird als die 
ursprünglichen Bilder ist paradoxerweise wenn beim PDF-Export eine 
Auflösungsreduktion aktiviert ist. Wenn z.B. Strichzeichnungen skaliert 
werden werden die Linien unscharf, was die Komprimierbarkeit 
verschlechtert. Also, wenn die ursprünglichen Bilder schon eine 
sinnvolle Auflösung haben und gut komprimiert sind, einfach mal die 
Auflösungsreduktion deaktivieren, häufig kommen dann kleinere PDFs raus.

von Schlaumaier (Gast)


Lesenswert?

NICHT als PDF abspeichern sondern DRUCKEN ( PDF-Drucker) drucken.

Dann entscheidet die Dokumentenauflösung (150 dpi reichen) über die 
Dateigröße.

von Erwin D. (Gast)


Lesenswert?

Andreas schrieb:
> Allerdings hätte ich das Openoffice eigentlich
> auch zugetraut.

Wer lesen kann, ist klar im Vorteil :-)
Beitrag "Re: Warum sind PDFs so groß?"

von Andreas (Gast)


Lesenswert?

Was sagt dieser Screenshot jetzt über die Effizienz der 
Bitmap-Komprimierung in OO aus?

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.