使用外部 URL 時的 Pandas read_csv 響應代碼

Question

我正在用pd.read_csv()替換requests.get() ，如果 pandas 沒有獲得相當於狀態代碼 200 的值，我想編寫一些異常邏輯。

有了請求，我可以寫：

response = requests.get(report_url)
if response.status_code != 200:

如何將相同的邏輯應用於pd.read_csv() ？ 我可以檢查任何狀態代碼嗎？

Answer 1

我的建議是編寫一個自定義閱讀器，可以在閱讀之前檢查 URL 是否有效，盡管這違背了目的

import requests
def custom_read(url):
    try: 
        return_file = pd.read_csv(url) 
    except requests.exceptions.HTTPError as err:
        raise
    else:
        return return_file

有效的 URL 將起作用

my_file = custom_read("https://people.sc.fsu.edu/~jburkardt/data/csv/addresses.csv")

這失敗並引發requests錯誤

my_file1 = custom_read("https://uhoh.com")

否則，一旦讀取DataFrame對象，就無法訪問其 URL 的狀態代碼。

Answer 2

您可以在read_csv()中使用url ，但它無法為您提供狀態代碼。 當它具有非 200 狀態代碼並且您必須使用try/except來捕獲它時，它只會引發錯誤。 您在其他答案中有示例。

但是，如果您必須使用requests ，那么您可以稍后使用io.StringIO創建類似文件的對象（內存中的文件）並在read_csv()中使用它。

import io
import requests
import pandas as pd

response = requests.get("https://people.sc.fsu.edu/~jburkardt/data/csv/addresses.csv")

print('status_code:', response.status_code)

#if response.status_code == 200:
if response.ok:
    df = pd.read_csv( io.StringIO(response.text) )
else:
    df = None

print(df)

與使用帶有<form>的HTML創建獲取csv的網頁時可以使用io.StringIO的方式相同。

據我所知read_csv(url)以類似的方式工作 - 它使用requests.get()從服務器獲取文件數據，然后使用io.StringIO讀取數據。

使用外部 URL 時的 Pandas read_csv 響應代碼

問題描述

2 個解決方案

解決方案1
2 2022-07-18 20:15:19

解決方案2
2 已采納 2022-07-18 20:34:05

使用外部 URL 時的 Pandas read_csv 響應代碼

問題描述

2 個解決方案

解決方案1 2 2022-07-18 20:15:19

解決方案2 2 已采納 2022-07-18 20:34:05

解決方案1
2 2022-07-18 20:15:19

解決方案2
2 已采納 2022-07-18 20:34:05