[英]How to extract html li tags
我想在 (li-label-span) 標簽下提取特定的“英文”文本。 我應該如何使用beautifulsoup
做到這一點? 如果有人來幫忙......你能為這個特定問題寫一些代碼嗎?
<div class="biblio-info-wrap">
<h2 class="biblio-title">
Product details</h2>
<ul class="biblio-info">
<li>
<label>Publication date</label>
<span itemprop="datePublished">18 Feb 2021</span>
</li>
<li>
<label>Publication City/Country</label>
<span>
Edinburgh, United Kingdom</span>
</li>
***<li>
<label>Language</label>
<span>
English</span>
</li>***
<li>
<label>Edition Statement</label>
<span>Main</span>
</li>
<li>
<label>ISBN10</label>
<span>1786892731</span>
</li>
</ul>
</div>
如果html_doc
包含您問題中的 HTML 代碼,您可以執行以下操作:
soup = BeautifulSoup(html_doc, "html.parser")
print(
soup.find("label", text="Language").find_next("span").get_text(strip=True)
)
印刷:
English
或使用 CSS 選擇器:
print(
soup.select_one('label:-soup-contains("Language") + span').get_text(
strip=True
)
)
進口 BeautifulSoup
from bs4 import BeautifulSoup
接着
soup = BeautifulSoup(html_doc, "html.parser")
name_tag =soup.find("label", text="Language").find_next("span").get_text(strip=True)
print(name_tag)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.