如何使用 beautifoulsoup 從特定 URL 下載數據並將結果保存為 excel 文件？

Question

我需要從這個網站下載標准普爾 500 指數公司的凈收入https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement

我按照在線指南（這個https://towardsdatascience.com/web-scraping-for-accounting-analysis-using-python-part-1-b5fc016a1c9a ）編寫了這部分代碼，但我不知道如何總結一下，更具體地說，如何將提取的凈收入下載到 excel 文件中。

import requests
import urllib.request
import time
from bs4 import BeautifulSoup

url = 'https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement'
response = requests.get(url)

response
soup = BeautifulSoup(response.text, 'html.parser')

income_statement = soup.findAll('a')[19]
link = income_statement['href']
download_url = 'https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement/'+ link

任何建議將不勝感激，謝謝！

Answer 1

我認為解決這個任務的正確方法是使用一些股票市場 API，而不是使用 BS4 進行網絡抓取。 我建議你看看下面的文章，它也包括一些實際例子： https : //towardsdatascience.com/best-5-free-stock-market-apis-in-2019-ad91dddec984

編輯：

如果你決定堅持使用你提到的這個確切 URL 的計划，我認為你應該嘗試使用pandas ，嘗試這樣的事情：

import pandas as pd
data = pd.read_html('https://www.macrotrends.net/stocks/charts/MMM/3m/income-statement',skiprows=1)

您必須稍微編碼一下，因為該表包含一些非 ascii 字符

如何使用 beautifoulsoup 從特定 URL 下載數據並將結果保存為 excel 文件？

問題描述

1 個解決方案

解決方案1
0 已采納 2020-03-31 21:26:23

如何使用 beautifoulsoup 從特定 URL 下載數據並將結果保存為 excel 文件？

問題描述

1 個解決方案

解決方案1 0 已采納 2020-03-31 21:26:23

解決方案1
0 已采納 2020-03-31 21:26:23