Wie kann ich dynamische Textnachrichten von Webseiten automatisiert sammeln? Es geht z.B. um die Seite www.fighterfitnessforum.com Da ist oben rechts immer ein Zitat, genannt "Glückskeks". Ich möchte diese Zitatsammlung auf meiner Platte speichern.
Vielleicht wget? Das kann man in einem Skript o.ä. je nach Betriebssystem regelmäßig aufrufen.
Seite grabben, und dann mit RegEx greppen. Ich würd python dafür nehmen, weil ich mich damit auskenne, aber das sollte mit was jeder Sprache gehen (C und Assembler wird aufwendig, aber Perl, Java, Python, bash (mit wget und grep), etc...) sollte gehen.
Diese RegEx auf den Quelltext sollte klappen, nicht besonders stabil, aber solange das nur für ein paar Tage läuft... /Glückskeks.*?<td.+?>.+?>".+?"/gsm
Nutzt der TO eigendlich Linux, oder doch eher Windows...?
> Nutzt der TO eigendlich Linux, oder doch eher Windows...?
Linux natürlich.
Das mit der Skriptprogrammierung muss ich mir in der Tat mal etwas näher
bringen. Nicht nur für den oben genannten Zweck.
Karl B. schrieb: > Linux natürlich. So soll das sein. Ich glaube, in der letzten oder vorletzten c't war ein Artikel über das automatisierte Holen von Webseiten?
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.