如何提取html li標簽

Question

我想在 (li-label-span) 標簽下提取特定的“英文”文本。 我應該如何使用beautifulsoup做到這一點？ 如果有人來幫忙......你能為這個特定問題寫一些代碼嗎？

<div class="biblio-info-wrap">
                <h2 class="biblio-title">
                    Product details</h2>
                <ul class="biblio-info">

                    <li>
                            <label>Publication date</label>
                            <span itemprop="datePublished">18 Feb 2021</span>
                        </li>
                   
                    <li>
                            <label>Publication City/Country</label>
                            <span>
                                Edinburgh, United Kingdom</span>
                        </li>
                    ***<li>
                            <label>Language</label>
                            <span>
                                English</span>
                        </li>***
                    <li>
                            <label>Edition Statement</label>
                            <span>Main</span>
                        </li>
                    <li>
                            <label>ISBN10</label>
                            <span>1786892731</span>
                        </li>
    
                    </ul>
            </div>

Answer 1

如果html_doc包含您問題中的 HTML 代碼，您可以執行以下操作：

soup = BeautifulSoup(html_doc, "html.parser")

print(
    soup.find("label", text="Language").find_next("span").get_text(strip=True)
)

印刷：

English

或使用 CSS 選擇器：

print(
    soup.select_one('label:-soup-contains("Language") + span').get_text(
        strip=True
    )
)

Answer 2

進口 BeautifulSoup

from bs4 import BeautifulSoup

接着

soup = BeautifulSoup(html_doc, "html.parser")
name_tag =soup.find("label", text="Language").find_next("span").get_text(strip=True)
print(name_tag)

如何提取html li標簽

問題描述

2 個解決方案

解決方案1
1 2021-05-22 20:21:28

解決方案2
0 2021-08-20 21:31:55

如何提取html li標簽

問題描述

2 個解決方案

解決方案1 1 2021-05-22 20:21:28

解決方案2 0 2021-08-20 21:31:55

解決方案1
1 2021-05-22 20:21:28

解決方案2
0 2021-08-20 21:31:55