繁体   English   中英

Python BeautifulSoup-无法从网页解析表

[英]Python BeautifulSoup - trouble parsing table from webpage

我想从以下站点解析表数据: 定价数据并创建具有所有表值(vCPU,内存,存储,价格)的数据框。 但是,使用以下代码,我似乎无法在页面上找到该表。 有人可以帮我弄清楚如何解析这些值吗?

使用pd.read_html时,将显示错误,表明未找到表。

 import pandas as pd from bs4 import BeautifulSoup import requests import csv url = "https://aws.amazon.com/ec2/pricing/on-demand/" r = requests.get(url) html_content = r.text soup = BeautifulSoup(html_content, 'html.parser') data=[] tables = soup.find_all('table') df = pd.read_html(url) 

如果您因动态内容而遇到麻烦,最好的方法是硒,它可以模拟浏览器体验,因此您不必担心管理cookie和动态Web内容附带的其他问题。 我能够使用以下内容抓取页面:

import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
from time import sleep

driver = webdriver.Firefox()
driver.get('https://aws.amazon.com/ec2/pricing/on-demand/')
sleep(3)
html = driver.page_source
soup = BeautifulSoup(html,'lxml')
driver.close()
data=[]
tables = soup.find_all('table')
print(tables)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM