簡體   English   中英

BeautifulSoup - 無法獲取 tbody

[英]BeautifulSoup - Can't get tbody

我正在嘗試獲取位於多個嵌套內的表。 我是 Beautifulsoup 的新手,我練習了一些簡單的 eeemples。 問題是,我不明白為什么我的代碼無法獲得具有 class “Explorer is-embed”的“div”標簽。 因為從那時起,我可以更深入地訪問go以到達我要抓取的所有數據所在的 tbody。 提前感謝您的幫助。

下面是我的代碼:

url = "https://ourworldindata.org/covid-cases"
url_content = requests.get(url)
soup = BeautifulSoup(url_content.text, "lxml")
########################
div1 = soup3.body.find_all("div", attrs={"class":"content-wrapper"})
div2 = div1[0].find_all("div", attrs={"class":"offset-content"})
sections = div2[0].find_all('section')
figure = sections[1].find_all("figure")
div3 = figure[0].find_all("div")
div4 = div3[0].find_all("div")

這是我沒有得到的“div”標簽的快照。 數字

數據是動態加載的。 相反,獲取公共源 csv(其他可用格式)

https://ourworldindata.org/coronavirus-source-data

import pandas as pd

df = pd.read_csv('https://covid.ourworldindata.org/data/owid-covid-data.csv')
df.head()

您在每日新確認的 COVID-19 病例(每 1M)表中看到的值是根據與該文件中比較的兩個日期相同的數據計算得出的,例如

在此處輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM