[英]Python Pandas remove white blank space after import data from excel
我将一些数据从 excel 导入到 dataframe。 在 excel 中有一些单元格是空白的(不是空的),即有人从键盘按空格键来填充 excel 中的单元格,因此没有字符,但看起来仍然是空白的。 在 dataframe 中,我尝试使用以下 function 进行清理。 但是 dataframe 清洗后不显示为 NAN。 是否有可用的 function 以便清洁?
df.columns = df.columns.str.strip()
我无法回复您的评论,因为我没有代表:(。
如果我对您的理解正确,您希望在有空格的地方放置一个 NaN 值?
我尝试了以下方法,它似乎有效,如果这有帮助,请告诉我。
import pandas as pd
import numpy as np
df = pd.DataFrame({'Names': ['betty', 'chris',' ', 'steve', 'carly']})
df.loc[df['Names'] == ' '] = np.nan
如果您需要遍历每一列,您可以将 df.loc 放在一个循环中,如下所示。
df = pd.DataFrame({'Names': ['betty', 'chris',' ', 'steve', 'carly'],'Age':\
['40', ' ', '32', '44', '69']})
for col in df.columns:
df[col].loc[df[col] == ' '] = np.nan
你确定df.columns = df.columns.str.strip()
是你想要的吗? 那只会更改列名。 如果要更改单元格内的值,请考虑replace
:
df.replace('^\s+$', np.nan, regex=True)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.