Forum: PC Hard- und Software Offline-Reader selbst programmieren?


von Torsten C. (torsten_c) Benutzerseite


Angehängte Dateien:

Lesenswert?

Hallo zusammen,

ich möchte Webseiten speichern, und zwar in einer Datei pro URL.

Es gibt dazu m.E. genau zwei Möglichkeiten:

1. Internet-Explorer *.mht-Datei (s. "Webarchiv" in Explorer.png) oder
2. mit Data-URLs (siehe http://de.wikipedia.org/wiki/Data-URL).

Oder gibt es noch eine dritte?

Bei "Webseite komplett" (siehe Bilder) werden Verzeichnisse angelegt, 
also mehr als eine Datei pro URL.

Bevor ich mir nun selbst was programmiere, um die eingebetteten Bilder 
in Data-URLs zu speichern: Kennt jemand ein Programm, dass das schon 
kann?

Trotz intensiver (vielleicht falscher?) Suche, habe ich nichts 
dergleichen gefunden.

VG Torsten

von pdf (Gast)


Lesenswert?

Irgendeinen PDF-"Drucker" installieren (z.B. PDFCreator) und dann aus 
dem Browser heraus als PDF-Datei ausdrucken wäre eine Möglichkeit.

von Michael B. (alter_mann)


Lesenswert?


von Torsten C. (torsten_c) Benutzerseite


Lesenswert?

pdf schrieb:
> Irgendeinen PDF-"Drucker" installieren

Ja, danke, hab' ich natürlich auch schon gemacht. Ich merke gerade, ich 
muss noch ein paar Anforderungen ergänzen:

▶ Leser und Ersteller haben vielleicht nur Windows (also weder Linux
   noch Apple darf vorausgesetzt werden).
▶ Die Datei soll hinterher noch als HTML-DOM interpretierbar sein,
   also kommen weder XPS noch PDF in Frage.
▶ …

Ich hoffe, das war alles.

Also :
Ich suche etwas, um HTML-Dateien mit Bildern als Data-URL zu 
speichern! CSS usw. müssten natürlich auch eingebettet sein.

: Bearbeitet durch User
von Rufus Τ. F. (rufus) Benutzerseite


Lesenswert?

Vielleicht ist das hier ja ein Einstieg:

http://dataurl.net/#dataurlmaker

von Torsten C. (torsten_c) Benutzerseite


Angehängte Dateien:

Lesenswert?

Rufus Τ. Firefly schrieb:
> Vielleicht ist das hier ja ein Einstieg:
> http://dataurl.net/#dataurlmaker

Ja, genau das meinte ich. Aber ich brauche nicht die ganze HTML-Datei 
als Data-URL (erstes Bild), sondern nur Bilder, CSS usw. (zweites Bild).

: Bearbeitet durch User
von Torsten C. (torsten_c) Benutzerseite


Lesenswert?

Torsten C. schrieb:
> Ich suche etwas, um HTML-Dateien mit Bildern als Data-URL zu
> speichern

Hmm, dann gibt es wohl nichts fertiges.

Also entweder Bild für Bild von Hand in den Quelltext hinein kopieren 
(wie Rufus meinte) oder halt selber eine Applikation basteln. Schade, 
danke.

von Arc N. (arc)


Lesenswert?

Torsten C. schrieb:
> Hallo zusammen,
>
> ich möchte Webseiten speichern, und zwar in einer Datei pro URL.
>
> Es gibt dazu m.E. genau zwei Möglichkeiten:
>
> 1. Internet-Explorer *.mht-Datei (s. "Webarchiv" in Explorer.png) oder
> 2. mit Data-URLs (siehe http://de.wikipedia.org/wiki/Data-URL).

Letzteres soll diese Chrome-Erweiterung nutzen: 
https://github.com/gildas-lormeau/SingleFile

ansonsten das MAFF Mozilla Archive Format
http://maf.mozdev.org/maff-file-format.html

von Torsten C. (torsten_c) Benutzerseite


Lesenswert?

Danke, Arc net(t). ;-) Das hätte ich nie gefunden!

Mozilla-MAFF ist ja wohl im Prinzip wie Internet-Explorer-MHT und 
versteht wohl nicht jeder Browser. "SingleFile" sieht "kompatibler" aus. 
:-)

Dann werde ich mir wohl mal Chrome installieren. :-)

von Kein Troll (Gast)


Lesenswert?

Eine URL besagt gar nichts. Eine einzelne URL kann viele Seiten 
beinhalten, wenn man zB mit Javascript arbeitet. Mit einem Button auf 
der Seite kann man einen POST machen und kriegt eine neue, andere Seite, 
die dieselbe URL haben kann.

von Läubi .. (laeubi) Benutzerseite


Lesenswert?

Wieso muss es eigentlich zwangsweise eine Datei sein?

von nixpeiler (Gast)


Lesenswert?

Jetzt mal ganz blöde gefragt,
wie willst Du denn Deine Bilder&Co. in einer Datei HTML konform 
hineinbringen ?
Du hast nur zwei Möglichkeiten, Du erstellst ein HD-Bild als JPG/PNG 
o.ä. und bindest das in eine HTML Datei (2 Dateien notwendig) oder Du 
nimmst einfach schon bestehendes wie z.B. httrack und speicherst alles 
lokal in einem Verzeichnis.
Der Rest ist propietär wie ja schon erkannt wurde.
Wozu soll das überhaupt gut sein ?

von Läubi .. (laeubi) Benutzerseite


Lesenswert?

nixpeiler schrieb:
> wie willst Du denn Deine Bilder&Co. in einer Datei HTML konform
> hineinbringen ?

Wurde doch schon genannt: Data-URLs ob das bei einer mäßig großen 
Website noch sinnvoll ist sei mal dahingestellt.

von nixpeiler (Gast)


Lesenswert?

Läubi .. schrieb:
> nixpeiler schrieb:
>> wie willst Du denn Deine Bilder&Co. in einer Datei HTML konform
>> hineinbringen ?
>
> Wurde doch schon genannt: Data-URLs ob das bei einer mäßig großen
> Website noch sinnvoll ist sei mal dahingestellt.

Was steht in der RFC ?
1
1. Abstract
2
3
   A new URL scheme, "data", is defined. It allows inclusion of small
4
   data items as "immediate" data, as if it had been included
5
   externally.
6
7
2. Description
8
9
   Some applications that use URLs also have a need to embed (small)
10
   media type data directly inline. This document defines a new URL
11
   scheme that would work like 'immediate addressing'. The URLs are of
12
   the form:
13
14
                    data:[<mediatype>][;base64],<data>
15
16
   The <mediatype> is an Internet media type specification (with
17
   optional parameters.) The appearance of ";base64" means that the data
18
   is encoded as base64. Without ";base64", the data (as a sequence of
19
   octets) is represented using ASCII encoding for octets inside the
20
   range of safe URL characters and using the standard %xx hex encoding
21
   of URLs for octets outside that range.  If <mediatype> is omitted, it
22
   defaults to text/plain;charset=US-ASCII.  As a shorthand,
23
   "text/plain" can be omitted but the charset parameter supplied.
24
25
   The "data:" URL scheme is only useful for short values. Note that
26
   some applications that use URLs may impose a length limit; for
27
   example, URLs embedded within <A> anchors in HTML have a length limit
28
   determined by the SGML declaration for HTML [RFC1866]. The LITLEN
29
   (1024) limits the number of characters which can appear in a single
30
.
31
.
32
.
33
  (The embedded image is probably near the limit of utility. For anything
34
   else larger, data URLs are likely to be inappropriate.)
35
.
36
.
37
.
Mal abgesehen davon das das nicht vollumfänglich den Wünschen des TO 
entspricht ...
Und z.B. IE das erst seit Version 8 kann und zwar bis MAXIMAL 32kB ?
Wenn man ja jetzt wüßte wozu ...

von Tive (Gast)


Lesenswert?

Torsten C. schrieb:
> Bevor ich mir nun selbst was programmiere, um die eingebetteten Bilder
> in Data-URLs zu speichern: Kennt jemand ein Programm, dass das schon
> kann?

tar, zip, usw.

von Torsten C. (torsten_c) Benutzerseite


Lesenswert?

nixpeiler schrieb:
> Wozu soll das überhaupt gut sein ?

Fragst Du, wozu die Funktion "Seite speichern unter …" ➜ "Webseite 
komplett" gut sein soll?

Läubi .. schrieb:
> Wieso muss es eigentlich zwangsweise eine Datei sein?

Eine einzelne Datei ist z.B. einfacher bei E-Mails: Einfach darauf 
klicken, nicht erst enpacken und später die entpackten Dateien wieder 
löschen müssen.

Tive schrieb:
> tar, zip, usw.

Genau das wird ja in Mozilla-MAFF und IE-MHT gemacht, aber die Formate 
sind nicht kompatibel zwischen den Browsern.

Die Größenbeschränkung bei Data-URLs  ist natürlich auch Mist.

Ich werde mich mal mit den Unterschieden von Mozilla-MAFF und IE-MHT 
beschäftigen. Vielleicht kann man die ja so modifizieren, dass sie von 
mehreren Browsern verstanden werden.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.