簡體   English   中英

使用python從HTML頁面獲取數據

[英]Get data from HTML page using python

我想使用python和漂亮的湯從下面的標簽中獲取值100

<span style="font-size:90%"><b>100</b> <cite style="color:#cc0000"><b>-0.10</b> (0.52%)</cite></span>

下面的代碼為我提供了以下輸出

100 -0.10 (0.52%)

如何僅提取值100?

碼:

from urllib.request import Request, urlopen
import bs4 
import re

url =  'url.com'
req = Request(url, headers = {'User-Agent': 'Mozilla/5.0'})
page = urlopen(req).read()
soup = bs4.BeautifulSoup(page, 'html.parser')
data = soup.find('span',style=re.compile('font-size:90%'))
value = data.text

您可以得到soup.contents的第一個元素:

from bs4 import BeautifulSoup as soup
d = soup(page, 'html.parser').find('span', {'style':'font-size:90%'}).contents[0].text

輸出:

'100'

只要找到<b>標記,它就會給您100。

data = soup.find('span',style=re.compile('font-size:90%'))
value = data.find('b').text

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM