使用python从HTML页面获取数据

Question

我想使用python和漂亮的汤从下面的标签中获取值100

<span style="font-size:90%"><b>100</b> <cite style="color:#cc0000"><b>-0.10</b> (0.52%)</cite></span>

下面的代码为我提供了以下输出

100 -0.10 (0.52%)

如何仅提取值100？

码：

from urllib.request import Request, urlopen
import bs4 
import re

url =  'url.com'
req = Request(url, headers = {'User-Agent': 'Mozilla/5.0'})
page = urlopen(req).read()
soup = bs4.BeautifulSoup(page, 'html.parser')
data = soup.find('span',style=re.compile('font-size:90%'))
value = data.text

Answer 1

您可以得到soup.contents的第一个元素：

from bs4 import BeautifulSoup as soup
d = soup(page, 'html.parser').find('span', {'style':'font-size:90%'}).contents[0].text

输出：

'100'

Answer 2

只要找到<b>标记，它就会给您100。

data = soup.find('span',style=re.compile('font-size:90%'))
value = data.find('b').text

使用python从HTML页面获取数据

问题描述

2 个解决方案

解决方案1
3 2019-04-25 15:57:11

解决方案2
3 2019-04-25 16:01:00

使用python从HTML页面获取数据

问题描述

2 个解决方案

解决方案1 3 2019-04-25 15:57:11

解决方案2 3 2019-04-25 16:01:00

解决方案1
3 2019-04-25 15:57:11

解决方案2
3 2019-04-25 16:01:00