簡體   English   中英

如何提取html li標簽

[英]How to extract html li tags

我想在 (li-label-span) 標簽下提取特定的“英文”文本。 我應該如何使用beautifulsoup做到這一點? 如果有人來幫忙......你能為這個特定問題寫一些代碼嗎?

<div class="biblio-info-wrap">
                <h2 class="biblio-title">
                    Product details</h2>
                <ul class="biblio-info">

                    <li>
                            <label>Publication date</label>
                            <span itemprop="datePublished">18 Feb 2021</span>
                        </li>
                   
                    <li>
                            <label>Publication City/Country</label>
                            <span>
                                Edinburgh, United Kingdom</span>
                        </li>
                    ***<li>
                            <label>Language</label>
                            <span>
                                English</span>
                        </li>***
                    <li>
                            <label>Edition Statement</label>
                            <span>Main</span>
                        </li>
                    <li>
                            <label>ISBN10</label>
                            <span>1786892731</span>
                        </li>
    
                    </ul>
            </div>

如果html_doc包含您問題中的 HTML 代碼,您可以執行以下操作:

soup = BeautifulSoup(html_doc, "html.parser")

print(
    soup.find("label", text="Language").find_next("span").get_text(strip=True)
)

印刷:

English

或使用 CSS 選擇器:

print(
    soup.select_one('label:-soup-contains("Language") + span').get_text(
        strip=True
    )
)

進口 BeautifulSoup

from bs4 import BeautifulSoup

接着

soup = BeautifulSoup(html_doc, "html.parser")
name_tag =soup.find("label", text="Language").find_next("span").get_text(strip=True)
print(name_tag)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM