Forum: PC-Programmierung Python, Beautifulsoup find all

von Robin (Gast)

17.04.2016 01:41

Lesenswert?

•

Hi,

derzeit suche ich so in einer eingelesenen html

My_URL = BeautifulSoup(urlopen("pfad"), "html.parser")
result = My_URL.find("span", {"itemprop": "name"}).get_text()


Das klappt eig. auch gut. Jetzt kommt allerdings

<span itemprop="name">

 mehrmals vor. Wie kann ich mir die ersten 2 auslesen und nicht nur das 
erste?

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python, Beautifulsoup find all

von Tom (Gast)

17.04.2016 02:18

Lesenswert?

•

▲
▼

find_all statt find?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python, Beautifulsoup find all

von Seb (Gast)

17.04.2016 12:20

Lesenswert?

•

▲
▼

Wird nicht gehen. get_text gibt es in find_all nicht

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python, Beautifulsoup find all

von Planlos (Gast)

17.04.2016 15:01

Lesenswert?

•

▲
▼

Seb schrieb:
> Wird nicht gehen. get_text gibt es in find_all nicht

Du willst ja auch nicht get_text von allen, sondern nur von den ersten 
Zwei.

Also: find_all, erste zwei wählen, get_text auf's erste, get_text auf's 
zweite anwenden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python, Beautifulsoup find all

von Robin (Gast)

18.04.2016 20:46

Lesenswert?

•

▲
▼

Hi,

also ich habe da jetzt 2 Tage lang herumprobiert, aber ich bekomme es 
nicht hin.

My_URL = BeautifulSoup(urlopen("pfad"), "html.parser")                    
result = My_URL.findAll("span", {"itemprop": "name"})
print (result)

Dann bekomme ich das hier.

<span itemprop="name">Text1</span>, <span itemprop="name">Text2</span>, <span itemprop="name">Text3</span>

Aber wie bekomme ich das html in Text?
print (result.text)
AttributeError: 'ResultSet' object has no attribute 'text'

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python, Beautifulsoup find all

von Tom (Gast)

18.04.2016 20:51

Lesenswert?

•

▲
▼

http://stackoverflow.com/a/36091352

Ohne googlen und Doku kommt man nicht weit.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python, Beautifulsoup find all

von Sheeva P. (sheevaplug)

18.04.2016 21:04

Lesenswert?

•

▲
▼

Robin schrieb:
> also ich habe da jetzt 2 Tage lang herumprobiert, aber ich bekomme es
> nicht hin.
>
>

> My_URL = BeautifulSoup(urlopen("pfad"), "html.parser")
> result = My_URL.findAll("span", {"itemprop": "name"})
> print (result)

>
>

> Aber wie bekomme ich das html in Text?
> print (result.text)
> AttributeError: 'ResultSet' object has no attribute 'text'


"result" ist eine Instanz der Klasse "ResultSet", das ist im Prinzip 
eine Liste von Instanzen der Klasse "bs4.element.Tag". Was Du jedoch 
willst, ist

results = My_URL.findAll('span')[0:2]   # man beachte das slice am Ende
for result in results:
    print result.getText()


oder für Fortgeschrittene mit List Comprehension:

1	print [a for a in My_URL.findAll('span')[0:2]]

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net