繁体   English   中英

如何使用 pandas 擦除某个列中的“nan”值?

[英]How to erase 'nan' values that are in a certain column using pandas?

我有一列有一堆混合了“nan”的行。 我只想删除“nan”,而不是包含“nan”的整行。 该列中的某些单元格有多个 nan,例如:nan、nan、nan、nan,而某些单元格的名称是我需要的 nan,例如:Jefferson,nan,nan,nan

我怎样才能抹去nan?

您可以尝试将 nan 替换为某个值,例如 0 或 ""? pandas.DataFrame.fillna

来自: geekforgeek

在 Pandas DataFrame 中用零替换 NaN 值的方法:

fillna()
The fillna() function is used to fill NA/NaN values using the specified method.
replace()
The dataframe.replace() function in Pandas can be defined as a simple method used to replace a string, regex, list, dictionary etc. in a DataFrame.

替换 NaN 值的步骤:

For one column using pandas:

df['DataFrame Column'] = df['DataFrame Column'].fillna(0)

For one column using numpy:

df['DataFrame Column'] = df['DataFrame Column'].replace(np.nan, 0)

For the whole DataFrame using pandas:

df.fillna(0)

For the whole DataFrame using numpy:

df.replace(np.nan, 0)

我的建议:当您使用字符串时,将 NaN 替换为空格“”,并在处理 dataframe 时跳过该值 ==“”

这应该有效。 我正在使用正则表达式仅匹配'nan''nan,<something>'并且我将其替换为空字符串''

我决定使用正则表达式,因为根据您的问题,我认为您不能使用文字字符串,因为您不知道确切是在单元格内(可以是任意数量的'nan's .

import pandas as pd

data = {'names': ['Jefferson', 'nan', 'Olivia', 'nan', 'nan', 'nan,nan,nan', 'Rebekah'],
        'numbers': [1, 2, 3, 4, 5, 6, 7]}

df = pd.DataFrame(data=data)
df['names'] = df['names'].replace({r'^nan$': '', r'^nan,.*': ''}, regex=True)
df

如果我们不是在谈论字符串'nan'那么df.fillna('')应该可以。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM