簡體   English   中英

使用BeautifulSoup進行HTML抓取

[英]HTML Scraping with BeautifulSoup

我正在搜尋

<span>Status:</span>,
  <span><strong>Moored</strong></span>,
  <strong>Moored</strong

並拉出系Moored 我已經嘗試了很多東西,但是還沒有得到。 最近一次find(attrs={'span':'Status:'})但這只返回[] HTML中有很多標記為<strong>的東西,但這是<span>Status:之后的唯一<strong> <span>Status:

編輯:上面的HTML代碼是運行a = soup.find_all(attrs={'class':'vertical-offset-10 group-ib'})然后使用a = (row.findChildren())

在HTML中:

<div class="vertical-offset-10 group-ib">
                    <span>Status:</span>
                    <span><strong>Moored</strong></span>
                </div>

澄清一下,我想要的只是字符串Moored

res = soup.find_all('span', text="Status:")
res[0].parent.find('strong').text

soup.find_all搜索包含文本"Result:"所有<span>標記,然后獲取next_sibling(下一個<span>標記)並獲取該標記的文本內容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM