簡體   English   中英

從芝加哥商品交易所網站抓取數據

[英]scraping data from Chicago Mercantile Exchange website

我正在嘗試從 CME 網站的表格中抓取數據。 具體來說,我想提取每種未來貨幣的未平倉合約數據。 但是當我嘗試解析表格時,它什么也沒給我。

我試圖從中抓取下面給出的數據的鏈接是我試圖通過的代碼。

from bs4 import BeautifulSoup
import requests

url="https://www.cmegroup.com/market-data/volume-open-interest/fx-volume.html"

# Make a GET request to fetch the raw HTML content
html_content = requests.get(url).text

# Parse the html content
soup = BeautifulSoup(html_content)
table = soup.find("table", attrs={"class": "cmeData voiDataset"})
print(table)

表數據來自另一個可以使用的 HTML 文檔

from bs4 import BeautifulSoup
import requests

url = 'https://www.cmegroup.com/CmeWS/mvc/xsltTransformer.do?xlstDoc=/XSLT/md/voi/voi_asset_class_final.xsl&url=/da/VOI/V2/Totals/TradeDate/20201116/AssetClassId/3/ReportType/F?excluded=CEE,CEU,KCB&hidelinks=false&html='

# Make a GET request to fetch the raw HTML content
html_content = requests.get(url).text

# Parse the html content
soup = BeautifulSoup(html_content)
table = soup.find("table", attrs={"class": "cmeData voiDataset"})
print(table)

要獲取特定日期的數據,您可以更改 URL,如下所示

# Date for 2020 November 12
date = '20201112'
url = 'https://www.cmegroup.com/CmeWS/mvc/xsltTransformer.do?xlstDoc=/XSLT/md/voi/voi_asset_class_final.xsl&url=/da/VOI/V2/Totals/TradeDate/{}/AssetClassId/3/ReportType/F?excluded=CEE,CEU,KCB&hidelinks=false&html='.format(date)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM