mikrocontroller.net

Forum: PC Hard- und Software regelmäßig Webseite nach Begriff durchsuchen


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
Autor: Nobbi (Gast)
Datum:

Bewertung
1 lesenswert
nicht lesenswert
Hallo

Ich suche nach einer Möglichkeit, eine Webseite mind. 2 mal täglich nach 
einem bestimmten Begriff zu durchsuchen. Wie bekomme ich das hin? Gibt 
es vielelciht Dienste dafür?

Autor: Rolf R. (dankobum)
Datum:

Bewertung
1 lesenswert
nicht lesenswert
Auf einem 24/7 Linux System einen cron-jobs starten, der zwei Mal 
täglich mit wget die html-Seite runterlädt. Dann mit grep die html-Datei 
durchsuchen.

Autor: imonbln (Gast)
Datum:

Bewertung
1 lesenswert
nicht lesenswert
Wie mein Vorredner schon gesagt hat, einen kleinen Linux Server nehmen, 
vielleicht einen raspberry pi und in einer Sprache die dir liegt 
Webscraping der Entsprechenden Seite machen.
Im minimal Fall reicht hier wget und grep, wenn es etwas mehr sein soll 
würde ich ein kleines Programm schrieben, das z.b. mit einen XML Parser 
auch den XPath berücksichtigt.

Autor: Oliver S. (oliver_s)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hallo,

ich würde das Script urlwatch https://github.com/thp/urlwatch dafür 
nehmen. Du kannst entsprechende Filter definieren (Xpath, grep) und dich 
bei Änderung gleich per Mail (oder andere Notifier) informieren lassen. 
Gestartet wird das Ganze per Cronjob auf einem Linux-Rechner. Da 
urlwatch in Python geschrieben ist, sollte es aber auch unter Windows 
funktionieren.

Autor: Brieftaubenzüchter (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Nobbi schrieb:
> Gibt es Dienste dafür?

Frage ist noch nicht endgültig beantwortet. Eigner Server kostet täglich 
Strom. Es gab z.B. im Web einen Webdienst der Webseiten als Mail 
lieferte.

Autor: Zitronen F. (jetztnicht)
Datum:

Bewertung
1 lesenswert
nicht lesenswert
> Eigner Server kostet täglich Strom.

aha. Der Dienst soll natuerlich gratis sein. Ganz klar. Wird gemacht.

Allenfalls kann man diese Aenderung auch gleich beim Betreiber der Seite 
abonnieren...

: Bearbeitet durch User
Autor: Dietmar S. (didi2)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Brieftaubenzüchter schrieb:
> Frage ist noch nicht endgültig beantwortet. Eigner Server kostet täglich
> Strom.

Mein Heim-Server braucht nur 4,5 Watt, das ist weniger als ein 
Radiowecker verbraucht. Darum würde ich mir wirklich keine Sorgen 
machen.

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.