[英]Pandas read_csv fillna
我有一些数据,我正在读取CSV文件,一个数据帧列记录在不同的时间戳间隔(时间序列数据),我不能得到一个df.fillna(method = 'ffill').fillna(method = 'bfill')
工作。
如果我没有使用keep_default_na=False
读取CSV文件,则Python填补了NaN的空白,但我希望这些空白是空白的,所以我可以使用df.fillna(method = 'ffill')
import pandas as pd
import numpy as np
#read CSV file
df_raw = pd.read_csv('C:\\desktop\\combinedSP.csv', index_col='Date', parse_dates=True, keep_default_na=False)
df_raw.head()
df_raw2 = df_raw.fillna(method = 'ffill').fillna(method = 'bfill')
df_raw2.head()
似乎无论我尝试什么,我都没有在标有OAT
的列上解决问题:(
任何提示大为赞赏,我有CSV文件在这里加载到我的GitHub的帐户。
当你执行keep_default_na=False
这意味着read_csv
通常会读取并解析为NaN,它将不再:
默认情况下,以下值被解释为NaN:
'', '#N/A', '#N/AN/A', '#NA', '-1.#IND', '-1.#QNAN', '-NaN', '-nan', '1.#IND', '1.#QNAN', 'N/A', 'NA', 'NULL', 'NaN', 'n/a', 'nan', 'null'
。
在这种情况下,它不会将空字符串''
解析为NaN,而是将它们保留为空字符串。
放下那个kwarg和fillnas应该工作。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.