[英]parsing returned HTML by beautifulsoup
我試圖在這里解析一些html並使用漂亮的湯
在這一點上,我搜索特定的div標簽,如下所示:
print soup.find("div", {"class": "sorteringsvalg Alle"})
並且返回的輸出如下:
<div class="sorteringsvalg Alle"> Alle <label class="sorteringtype">
<input checked="" name="type" type="radio" value="Alle"/>(638) </label></div>
我感興趣的是方括號中的數字,因此我需要進一步處理此數據。 我試過對此使用're'正則表達式,但返回的對象未表示為字符串,因此無法正常工作。
您可能會在標記內獲得字符串,如下所示:
print soup.find("label").get_text(strip=True)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.