Forum: PC Hard- und Software Dynamische Textinhalte von Webseiten automatisch sammeln


von Karl B. (Gast)


Lesenswert?

Wie kann ich dynamische Textnachrichten von Webseiten automatisiert 
sammeln?
Es geht z.B. um die Seite www.fighterfitnessforum.com
Da ist oben rechts immer ein Zitat, genannt "Glückskeks". Ich möchte 
diese Zitatsammlung auf meiner Platte speichern.

von Klaus W. (mfgkw)


Lesenswert?

Vielleicht wget?
Das kann man in einem Skript o.ä. je nach Betriebssystem regelmäßig 
aufrufen.

von Verwirrter Anfänger (Gast)


Lesenswert?

Seite grabben, und dann mit RegEx greppen.

Ich würd python dafür nehmen, weil ich mich damit auskenne, aber das 
sollte mit was jeder Sprache gehen (C und Assembler wird aufwendig, aber 
Perl, Java, Python, bash (mit wget und grep), etc...) sollte gehen.

von Verwirrter Anfänger (Gast)


Lesenswert?

Diese RegEx auf den Quelltext sollte klappen, nicht besonders stabil, 
aber solange das nur für ein paar Tage läuft...

/Glückskeks.*?<td.+?>.+?>".+?"/gsm

von Ronny M. (hobby-coder)


Lesenswert?

Nutzt der TO eigendlich Linux, oder doch eher Windows...?

von Karl B. (Gast)


Lesenswert?

> Nutzt der TO eigendlich Linux, oder doch eher Windows...?

Linux natürlich.

Das mit der Skriptprogrammierung muss ich mir in der Tat mal etwas näher 
bringen. Nicht nur für den oben genannten Zweck.

von Klaus W. (mfgkw)


Lesenswert?

Karl B. schrieb:
> Linux natürlich.

So soll das sein.

Ich glaube, in der letzten oder vorletzten c't war ein Artikel über das 
automatisierte Holen von Webseiten?

von Zwie B. (zwieblum)


Lesenswert?

1
w3m -dump
 ist auch ganz brauchbar

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.