Forum: PC-Programmierung Webseitenarchivierung mit PHP


von berne (Gast)


Lesenswert?

Wie kann ich eine komplette Seite mit allen Bildern, JavaScript etc. als 
Seite speichern. Ich würde gerne ein Archiv erstellen.

Die Seite soll einfach genau so aussehen wie wenn Sie lokal abgerufen 
wird, Skripte müssen in der Kopie nicht mehr funktionieren, sondern nur 
beim "Betrachten" ausgeführt werden.

von Frank (Gast)


Lesenswert?

In PHP kann man TCP-Sockets erstellen. Dann könnte man ein GET-Statement 
aufrufen und Alles was der Server schickt in eine Datei oder Datenbank 
pumpen. Bilddaten werden so aber nicht mit gespeichert, sondern nur 
deren Adressen, ebenso iFrames und Alles, was nicht direkter Bestandteil 
der aufgerufenen Seite ist ...

von Jan H. (j_hansen)


Lesenswert?

1. Was meinst du mit "PHP"? Ich weiß schon, die Programmiersprache. Aber 
mit PHP archiviert man keine Webseite, sondern erzeugt sie.

2. Einfache Seiten kann man schon archivieren, indem man einfach alles 
ausgehend von der Hauptseite herunterlädt. Dafür gibt es auch eigene 
Programme. Allerdings sind heutzutage sehr viele Seiten (besonders wenn 
sie in PHP geschrieben sind) dynamisch. Das heißt je nach Anfrage des 
Client-Browsers werden die Seiten dynamisch erzeugt. Das kann man dann 
nicht mehr einfach herunterladen.

von Berne (Gast)


Lesenswert?

Danke euch.

Die zu kopierende Seite ist nur eine statische Seite (HTML und 
javascript).

Die Bilder müssten aber kopiert werden.

von Berne (Gast)


Lesenswert?

Die Archivierung muss mit PHP geschehen. Soll einfach eine Seite 
generieren mit dem Inhalt der aktuellen.

von Peter II (Gast)


Lesenswert?

Berne schrieb:
> Die Archivierung muss mit PHP geschehen.

warum? Man kann auch mit PHP ein externen Programm starten was die 
Archivierung übernimmt.

Sonst muss die selber HTML parsen. Alle Image, CSS, JavaScripts usw. 
Extrahieren diese dann Downloaden, dann noch die URL abändern wenn sie 
nicht relative ist usw.

Deine Fragestellung lässt aber vermuten das du das nicht in sinnvoller 
Zeit schaffen wirst.

von Peter II (Gast)


Lesenswert?

Frank schrieb:
> In PHP kann man TCP-Sockets erstellen. Dann könnte man ein GET-Statement
> aufrufen

naja etwas umständlich. PHP kann selber einfach Daten von einem 
Webserver abrufen (open einfach mit URL verwenden) dann geht sogar https 
was man mit TCP nicht mal schnell schafft.

von D. I. (Gast)


Lesenswert?

exec("wget ...")

von Rufus Τ. F. (rufus) Benutzerseite


Lesenswert?

berne schrieb:
> Wie kann ich eine komplette Seite mit allen Bildern, JavaScript etc. als
> Seite speichern. Ich würde gerne ein Archiv erstellen.

Willst Du das automatisieren? Sonst reicht ein "Datei->Seite speichern" 
in Deinem Webbrowser.

von berne (Gast)


Lesenswert?

Ich will nicht nur die html kopieren, sondern auch alle Inhalte neu auf 
dem Server speichern. Das beinhaltet dann wohl auch die Bildadressen 
etc. Wenn ich das über den Browser mache geht das natürlich -  genau das 
möchte ich aber automatisieren.

von Chris R. (hownottobeseen)


Lesenswert?

Hi,

wenn du eine Seite, die PHP benutzt, herunterladen willst - suchst du 
vielleicht http://www.httrack.com/ ?

Andersrum - eine fremde Seite mit einem PHP-Script als Werkzeug 
herunterladen - ist nicht ganz so trivial. Httrack kann aber als 
inspiration dienen ;)

HTH

Chris

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.