[英]Scraping data from a website using Python
是的,假设页面上存在数据,您可以使用请求获取页面,然后提取所需的数据。 它看起来像
import requests
page = requests.get(url="https://xsi.xeneta.com/")
data = page.content
print(data)
这将为您提供一个起点,至少可以进行您想要的任何处理。
对于此处可能有用的一些功能-https://www.w3schools.com/python/ref_requests_response.asp
如果您检查图表,您会看到它嵌套在 iframe 内。 我抓住了第一个图表并直接导航到该站点,而不是 xsi.xeneta.com。 您还可以看到 data-json 属性中有很多数据,因此此代码使用 selenium 打印该数据。
进口:
pip install selenium
pip install webdriver-manager
代码:
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.implicitly_wait(5)
driver.get("https://xsi-short.xeneta.com/xsic/chart/asia-europe/")
canvas = driver.find_element_by_xpath('//*[@id="chart-visualization-b9948b5ccd27f73bf764abe4a935c502"]')
print(canvas.get_attribute("data-json"))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.