mikrocontroller.net

Forum: Offtopic PDFs über Archive.org herunterladen


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
Autor: Klaus I. (klauspi)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Gibt es eigentlich einen eleganten Weg um alle PDF-Dateien von einer 
bestimmten URL über Archive.org herunterzuladen?

Autor: Bonzo N. (jetztnicht)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Im Sinne von GET \....\* ?

Autor: Uhu U. (uhu)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
- alle URLs mit Endung .pdf aus der html-Datei pulen - z.B. mit awk
- Skript generieren, das die Dateien mit wget herunterlädt
- Skript ausführen

Ist aber nur im Prinzip einfach ;-)

Autor: Klaus I. (klauspi)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Besten Dank, irgendwie habe ich auf eine einfache Lösung gehofft, die 
ich übersehen habe.

Zum halb-manuellen zurecht-trimmen der Links bin ich ein paar mal 
zwischen Notepad und Excel gewechselt.

Jetzt laufen die Downloads mit wget und ich dazu habe einiges über die 
Unzulänglichkeiten der Windows-Kommandozeile dazugelernt ;o)

Grüße
Klaus

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail, Yahoo oder Facebook? Keine Anmeldung erforderlich!
Mit Google-Account einloggen | Mit Facebook-Account einloggen
Noch kein Account? Hier anmelden.