簡體   English   中英

如何使用 beautifoulsoup 從特定 URL 下載數據並將結果保存為 excel 文件?

[英]How can i download data from a specific URL using beautifoulsoup and saving the result as an excel file?

我需要從這個網站下載標准普爾 500 指數公司的凈收入https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement

我按照在線指南(這個https://towardsdatascience.com/web-scraping-for-accounting-analysis-using-python-part-1-b5fc016a1c9a )編寫了這部分代碼,但我不知道如何總結一下,更具體地說,如何將提取的凈收入下載到 excel 文件中。

import requests
import urllib.request
import time
from bs4 import BeautifulSoup

url = 'https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement'
response = requests.get(url)

response
soup = BeautifulSoup(response.text, 'html.parser')

income_statement = soup.findAll('a')[19]
link = income_statement['href']
download_url = 'https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement/'+ link

任何建議將不勝感激,謝謝!

我認為解決這個任務的正確方法是使用一些股票市場 API,而不是使用 BS4 進行網絡抓取。 我建議你看看下面的文章,它也包括一些實際例子: https : //towardsdatascience.com/best-5-free-stock-market-apis-in-2019-ad91dddec984

編輯:

如果你決定堅持使用你提到的這個確切 URL 的計划,我認為你應該嘗試使用pandas ,嘗試這樣的事情:

import pandas as pd
data = pd.read_html('https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement​',skiprows=1)

您必須稍微編碼一下,因為該表包含一些非 ascii 字符

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM