如何使用 pandas 擦除某個列中的“nan”值？

Question

我有一列有一堆混合了“nan”的行。 我只想刪除“nan”，而不是包含“nan”的整行。 該列中的某些單元格有多個 nan，例如：nan、nan、nan、nan，而某些單元格的名稱是我需要的 nan，例如：Jefferson,nan,nan,nan

我怎樣才能抹去nan？

Answer 1

您可以嘗試將 nan 替換為某個值，例如 0 或 ""？ pandas.DataFrame.fillna

Answer 2

來自： geekforgeek

在 Pandas DataFrame 中用零替換 NaN 值的方法：

fillna()
The fillna() function is used to fill NA/NaN values using the specified method.
replace()
The dataframe.replace() function in Pandas can be defined as a simple method used to replace a string, regex, list, dictionary etc. in a DataFrame.

替換 NaN 值的步驟：

For one column using pandas:

df['DataFrame Column'] = df['DataFrame Column'].fillna(0)

For one column using numpy:

df['DataFrame Column'] = df['DataFrame Column'].replace(np.nan, 0)

For the whole DataFrame using pandas:

df.fillna(0)

For the whole DataFrame using numpy:

df.replace(np.nan, 0)

我的建議：當您使用字符串時，將 NaN 替換為空格“”，並在處理 dataframe 時跳過該值 ==“”

Answer 3

這應該有效。 我正在使用正則表達式僅匹配'nan'或'nan,<something>'並且我將其替換為空字符串'' 。

我決定使用正則表達式，因為根據您的問題，我認為您不能使用文字字符串，因為您不知道確切是在單元格內（可以是任意數量的'nan's .

import pandas as pd

data = {'names': ['Jefferson', 'nan', 'Olivia', 'nan', 'nan', 'nan,nan,nan', 'Rebekah'],
        'numbers': [1, 2, 3, 4, 5, 6, 7]}

df = pd.DataFrame(data=data)
df['names'] = df['names'].replace({r'^nan$': '', r'^nan,.*': ''}, regex=True)
df

如果我們不是在談論字符串'nan'那么df.fillna('')應該可以。

如何使用 pandas 擦除某個列中的“nan”值？

問題描述

3 個解決方案

解決方案1
0 2022-07-26 14:16:09

解決方案2
0 2022-07-26 14:17:37

解決方案3
0 已采納 2022-07-26 14:18:32

如何使用 pandas 擦除某個列中的“nan”值？

問題描述

3 個解決方案

解決方案1 0 2022-07-26 14:16:09

解決方案2 0 2022-07-26 14:17:37

解決方案3 0 已采納 2022-07-26 14:18:32

解決方案1
0 2022-07-26 14:16:09

解決方案2
0 2022-07-26 14:17:37

解決方案3
0 已采納 2022-07-26 14:18:32