熊猫read_csv fillna

Question

我有一些数据，我正在读取CSV文件，一个数据帧列记录在不同的时间戳间隔（时间序列数据），我不能得到一个df.fillna(method = 'ffill').fillna(method = 'bfill')工作。

如果我没有使用keep_default_na=False读取CSV文件，则Python填补了NaN的空白，但我希望这些空白是空白的，所以我可以使用df.fillna(method = 'ffill')

import pandas as pd
import numpy as np

#read CSV file
df_raw = pd.read_csv('C:\\desktop\\combinedSP.csv', index_col='Date', parse_dates=True, keep_default_na=False)

df_raw.head()

df_raw2 = df_raw.fillna(method = 'ffill').fillna(method = 'bfill')

df_raw2.head()

似乎无论我尝试什么，我都没有在标有OAT的列上解决问题:(

任何提示大为赞赏，我有CSV文件在这里加载到我的GitHub的帐户。

Answer 1

当你执行keep_default_na=False这意味着read_csv通常会读取并解析为NaN，它将不再：

默认情况下，以下值被解释为NaN： '', '#N/A', '#N/AN/A', '#NA', '-1.#IND', '-1.#QNAN', '-NaN', '-nan', '1.#IND', '1.#QNAN', 'N/A', 'NA', 'NULL', 'NaN', 'n/a', 'nan', 'null' 。

在这种情况下，它不会将空字符串''解析为NaN，而是将它们保留为空字符串。

放下那个kwarg和fillnas应该工作。

熊猫read_csv fillna

问题描述

1 个解决方案

解决方案1
4 已采纳 2019-02-18 21:27:28

熊猫read_csv fillna

问题描述

1 个解决方案

解决方案1 4 已采纳 2019-02-18 21:27:28

解决方案1
4 已采纳 2019-02-18 21:27:28