簡體   English   中英

使用 Python 從 Web 讀取表

[英]Read table from Web using Python

我是 Python 的新手,我正在努力從網站https://www.screener.in/company/ABB/consolidated/上的特定表(最后一個表是Shareholding Pattern )中提取數據

我為此使用 BeautifulSoup 庫,但我不知道如何使用 go。

到目前為止,下面是我的代碼片段。 由於頁面有多個表並且所有表共享公共類和 ID,因此我無法選擇正確的表,這使我很難篩選出我想要的一個表。

import requests import urllib.request
from bs4 import BeautifulSoup
    
url = "https://www.screener.in/company/ABB/consolidated/"

r = requests.get(url)
print(r.status_code)
html_content = r.text
soup = BeautifulSoup(html_content,"html.parser")
# print(soup)
#data_table = soup.find('table', class_ = "data-table")
# print(data_table) table_needed = soup.find("<h2>ShareholdingPattern</h2>")
#sub = table_needed.contents[0] print(table_needed)

只需使用requestspandas 抓取最后一張表並將其轉儲到.csv文件中。

就是這樣:

import pandas as pd
import requests

df = pd.read_html(
    requests.get("https://www.screener.in/company/ABB/consolidated/").text,
    flavor="bs4",
)
df[-1].to_csv("last_table.csv", index=False)

Output 來自.csv文件:

在此處輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM