簡體   English   中英

從html文件的元素中提取信息

[英]extracting information from an element of html file

我想從以下字符串中提取402。 我正在用美麗的湯。

<span class="bla bla bla"> <span class="ba1 ba1">  </span>402.00</span>

我嘗試使用strip()但是元素bs4.element.resultset不允許這樣做。

請提出建議,我該怎么做?

任何指針將不勝感激

找到內部跨度並獲取next_sibling

soup.find('span', class_='bla').find('span', class_='ba1').next_sibling

演示:

>>> from bs4 import BeautifulSoup
>>> data = '<span class="bla bla bla"> <span class="ba1 ba1">  </span>402.00</span>'
>>> soup = BeautifulSoup(data)
>>> soup.find('span', class_='bla').find('span', class_='ba1').next_sibling
u'402.00'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM