簡體   English   中英

通過beautifulsoup解析返回的HTML

[英]parsing returned HTML by beautifulsoup

我試圖在這里解析一些html並使用漂亮的湯

在這一點上,我搜索特定的div標簽,如下所示:

print soup.find("div", {"class": "sorteringsvalg Alle"})

並且返回的輸出如下:

<div class="sorteringsvalg Alle"> Alle  <label class="sorteringtype">
<input checked="" name="type" type="radio" value="Alle"/>(638) </label></div>

我感興趣的是方括號中的數字,因此我需要進一步處理此數據。 我試過對此使用're'正則表達式,但返回的對象未表示為字符串,因此無法正常工作。

找到內部輸入並獲取下一個同級

div = soup.find("div", {"class": "sorteringsvalg Alle"})
print div.find("input", value="Alle").next_sibling.strip()

或者,只需使用CSS選擇器

soup.select("div.Alle input[value=Alle]")[0].next_sibling.strip()

您可能會在標記內獲得字符串,如下所示:

print soup.find("label").get_text(strip=True)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM