csv文件中多列的python pandas parse_dates

Question

我正在使用 Python pandas 進行兩個 csv 文件的比較，但在具有 5 個日期列的 csv 文件中，我在 read_csv 方法中使用了 parse_date=['dateofbirth','lastupdates','dateofjoin','dateofresign,'endoftrade'] 但是它只解析出生日期而不是 csv 文件中的所有列。

代碼：

csv_pandas=pd.read_csv("path of the csv file",parse_date=['dateofbirth','lastupdates','dateofjoin','dateofresign,'endoftrade'])
print(csv_pandas)

CSV 文件：

dateofbirth             lastupdates       dateofjoin          dateofresign 
05/06/2021 00:00:00PM 12/13/2021 12:00:00PM 12/13/2021 12:00:00PM 12/13/2021 12:00:00PM

column        non-null count   Dtype
------        -------------    ------
dateofbirth    non-null         object
dateofbirth    non-null         datetime64[ns]
dateofbirth    non-null         datetime64[ns]
dateofbirth    non-null         datetime64[ns]

我只能轉換對象 Dtype 列，剩余的 datetime64[ns] 不解析

我大約有 160 個 csv 文件，每個 csv 文件都有不同的列名，任何人都可以建議

Answer 1

您有兩種日期格式需要不同的strptime()格式指令。
並非您嘗試轉換的所有列都存在於數據框中，因此測試該列存在於作為 ** kwargs傳遞assign() dict理解中

csv_pandas = csv_pandas.assign(
    **{
        c: pd.to_datetime(csv_pandas[c], format="%Y-%m-%d %H:%M:%S:%f", errors="ignore")
        for c in parse_date
        if c in csv_pandas.select_dtypes("object").columns
    }
).pipe(
    lambda d: d.assign(
        **{
            c: pd.to_datetime(d[c], format="%m/%d/%Y %H:%M:%S%p", errors="ignore")
            for c in parse_date
            if c in d.select_dtypes("object").columns
        }
    )
)

輸出

csv_pandas.dtypes
dateofbirth     datetime64[ns]
lastupdates     datetime64[ns]
dateofjoin      datetime64[ns]
dateofresign    datetime64[ns]
dtype: object

csv文件中多列的python pandas parse_dates

問題描述

1 個解決方案

解決方案1
0 2021-07-14 09:32:13

輸出

csv文件中多列的python pandas parse_dates

問題描述

1 個解決方案

解決方案1 0 2021-07-14 09:32:13

輸出

解決方案1
0 2021-07-14 09:32:13