從html文件的元素中提取信息

Question

我想從以下字符串中提取402。 我正在用美麗的湯。

<span class="bla bla bla"> <span class="ba1 ba1">  </span>402.00</span>

我嘗試使用strip()但是元素bs4.element.resultset不允許這樣做。

請提出建議，我該怎么做？

任何指針將不勝感激

Answer 1

找到內部跨度並獲取next_sibling ：

soup.find('span', class_='bla').find('span', class_='ba1').next_sibling

演示：

>>> from bs4 import BeautifulSoup
>>> data = '<span class="bla bla bla"> <span class="ba1 ba1">  </span>402.00</span>'
>>> soup = BeautifulSoup(data)
>>> soup.find('span', class_='bla').find('span', class_='ba1').next_sibling
u'402.00'

從html文件的元素中提取信息

問題描述

1 個解決方案

解決方案1
4 2014-09-09 13:22:05

從html文件的元素中提取信息

問題描述

1 個解決方案

解決方案1 4 2014-09-09 13:22:05

解決方案1
4 2014-09-09 13:22:05