Forum: PC-Programmierung Python 3 URL-Request?

von Buggy (Gast)

07.10.2021 14:12

Lesenswert?

•

Funktioniert. In html stehen die Daten.

import urllib.request
with urllib.request.urlopen('https://duckduckgo.com/') as response:
    html = response.read()



Funktioniert nicht. Warum kommt die Fehlermeldung bei einem Request? Wo 
ist der Unterschied zu einem Browser bei dem sie nicht kommt?

with urllib.request.urlopen('https://mikrocontroller.net/') as response:
    html = response.read()


Fehlermeldung.

    raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python 3 URL-Request?

von Fruchtgurke (Gast)

07.10.2021 14:48

Lesenswert?

•

▲
▼

www vergessen?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python 3 URL-Request?

von Sebastian D. (minimalist)

07.10.2021 15:14

Lesenswert?

•

▲
▼

Nein, kein UserAgent angegeben. Viele Webserver rejecten dann.

import urllib.request
req = urllib.request.Request(
    "https://www.mikrocontroller.net/", 
    data=None, 
    headers={
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36'
with urllib.request.urlopen(req) as response:
    html = response.read()

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python 3 URL-Request?

von Gerd A. (gerd_a289)

07.10.2021 15:17

Lesenswert?

•

▲
▼

Probier mal:

import requests
r = requests.get("https://lerneprogrammieren.de";)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python 3 URL-Request?

von Heiner (Gast)

07.10.2021 15:23

Lesenswert?

•

▲
▼

Sebastian D. schrieb:
> Nein, kein UserAgent angegeben. Viele Webserver rejecten dann.

Richtig. Lustig ist, dass man sogar etwas völlig sinnfreies als user 
agent mitschicken kann und dann trotzdem die gewünschte Antwort bekommt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python 3 URL-Request?

von Sebastian D. (minimalist)

07.10.2021 15:39

Lesenswert?

•

▲
▼

Heiner schrieb:
> Richtig. Lustig ist, dass man sogar etwas völlig sinnfreies als user
> agent mitschicken kann und dann trotzdem die gewünschte Antwort bekommt.

Jein. Nicht alles. Der original User-Agent der Urllib wird vom Server 
aktiv geblockt.

    headers={
        'User-Agent': 'Python-urllib/2.7'
-->HTTPError: HTTP Error 403: Forbidden


Eine Epsilon Änderung dagegen bewirkt schon, dass die Seite ausgeliefert 
wird:

    headers={
        'User-Agent': 'Python-urllob/2.7'
-->geht durch


Das sagt uns eigentlich, dass der Webseitenbetreiber eventuell nicht 
gescraped werden möchte. Die Höflichkeit gebietet es dann, vor dem 
Abrufen größerer Datenmengen einmal freundlich beim Admin anzufragen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python 3 URL-Request?

von Buggy (Gast)

07.10.2021 16:02

Lesenswert?

•

▲
▼

@ Sebastian

Vielen Dank für deine Zeilen und die Erklärung :)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net