繁体 English 中英

带有请求和lxml的xpath报废，但是有问题

[英]Scraping with xpath with requests and lxml but having problems

原文 2018-08-01 15:37:10 7 2 python/ python-requests/ lxml/ scrape

使用xpath使用lxml抓取数据时，我一直遇到问题。 我想刮一下道琼斯工业平均价格，但是当我用python打印出来时，它说元素跨度为0x448d6c0。 我知道那一定是一块记忆，但是我只想要价格。 如何打印价格而不是价格在内存中的位置？

from lxml import html
import requests

page = requests.get('https://markets.businessinsider.com/index/realtime- 
chart/dow_jones')
content = html.fromstring(page.content)

#This will create a list of prices:
prices = content.xpath('//*[@id="site"]/div/div[3]/div/div[3]/div[2]/div/table/tbody/tr[1]/th[1]/div/div/div/span')

#This will create a list of volume:


print (prices)

2 个解决方案

正如您所说的，您将获得生成器，它们只是内存位置。 要访问它们，您需要在它们上调用一个函数，在这种情况下，您希望文本为.text

另外，我强烈建议更改您的XPath，因为它是字面上的位置，并且随时可能更改。

prices = content.xpath("//div[@id='site']//div[@class='price']//span[@class='push-data ']")
prices_holder = [i.text for i in prices]
prices_holder
 ['25,389.06',
 '25,374.60',
 '7,251.60',
 '2,813.60',
 '22,674.50',
 '12,738.80',
 '3,500.58',
 '1.1669',
 '111.7250',
 '1.3119',
 '1,219.58',
 '15.43',
 '6,162.55',
 '67.55']

还要注意，您只会在load处获得值。 如果您希望价格随价格变化而变化，则可能需要使用Selenium。

可变prices是包含Web元素的列表。 您需要调用text方法来提取值。

print(prices[0].text)

'25,396.03'

使用xpath / lxml刮取文本

[英]Scraping text with xpath/lxml

使用lxml和请求进行HTML爬取

[英]HTML Scraping with lxml and Requests

使用lxml和请求进行Web抓取

[英]Web scraping with lxml and requests

Web爬网LXML和请求

[英]Web Scraping LXML and requests

使用lxml和Xpath刮取元素

[英]Scraping an Element using lxml and Xpath

使用Python LXML XPath收集数据

[英]Scraping data with Python LXML XPath

使用lxml和python请求进行爬取。

[英]Scraping with lxml and python requests.

使用 Xpath 在 python 中抓取问题

[英]Problems scraping in python with Xpath

使用 lxml 和 XPath 抓取 href 标题

[英]Scraping href title using lxml and XPath

抓取 Xpath lxml 空白/空返回列表

[英]Scraping Xpath lxml blank/empty returned list

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用xpath / lxml刮取文本使用lxml和请求进行HTML爬取使用lxml和请求进行Web抓取 Web爬网LXML和请求使用lxml和Xpath刮取元素使用Python LXML XPath收集数据使用lxml和python请求进行爬取。使用 Xpath 在 python 中抓取问题使用 lxml 和 XPath 抓取 href 标题抓取 Xpath lxml 空白/空返回列表

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM