[英]Pandas read_csv fillna
我有一些數據,我正在讀取CSV文件,一個數據幀列記錄在不同的時間戳間隔(時間序列數據),我不能得到一個df.fillna(method = 'ffill').fillna(method = 'bfill')
工作。
如果我沒有使用keep_default_na=False
讀取CSV文件,則Python填補了NaN的空白,但我希望這些空白是空白的,所以我可以使用df.fillna(method = 'ffill')
import pandas as pd
import numpy as np
#read CSV file
df_raw = pd.read_csv('C:\\desktop\\combinedSP.csv', index_col='Date', parse_dates=True, keep_default_na=False)
df_raw.head()
df_raw2 = df_raw.fillna(method = 'ffill').fillna(method = 'bfill')
df_raw2.head()
似乎無論我嘗試什么,我都沒有在標有OAT
的列上解決問題:(
任何提示大為贊賞,我有CSV文件在這里加載到我的GitHub的帳戶。
當你執行keep_default_na=False
這意味着read_csv
通常會讀取並解析為NaN,它將不再:
默認情況下,以下值被解釋為NaN:
'', '#N/A', '#N/AN/A', '#NA', '-1.#IND', '-1.#QNAN', '-NaN', '-nan', '1.#IND', '1.#QNAN', 'N/A', 'NA', 'NULL', 'NaN', 'n/a', 'nan', 'null'
。
在這種情況下,它不會將空字符串''
解析為NaN,而是將它們保留為空字符串。
放下那個kwarg和fillnas應該工作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.