Forum: Offtopic PDFs über Archive.org herunterladen


von Klaus I. (klauspi)


Lesenswert?

Gibt es eigentlich einen eleganten Weg um alle PDF-Dateien von einer 
bestimmten URL über Archive.org herunterzuladen?

von Pandur S. (jetztnicht)


Lesenswert?

Im Sinne von GET \....\* ?

von Uhu U. (uhu)


Lesenswert?

- alle URLs mit Endung .pdf aus der html-Datei pulen - z.B. mit awk
- Skript generieren, das die Dateien mit wget herunterlädt
- Skript ausführen

Ist aber nur im Prinzip einfach ;-)

von Klaus I. (klauspi)


Lesenswert?

Besten Dank, irgendwie habe ich auf eine einfache Lösung gehofft, die 
ich übersehen habe.

Zum halb-manuellen zurecht-trimmen der Links bin ich ein paar mal 
zwischen Notepad und Excel gewechselt.

Jetzt laufen die Downloads mit wget und ich dazu habe einiges über die 
Unzulänglichkeiten der Windows-Kommandozeile dazugelernt ;o)

Grüße
Klaus

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.