繁体   English   中英

如何从传递到 python 中的 dataframe 的列表中删除空白和 null 值

[英]How to remove blank and null values from a list that passed into dataframe in python

我有 dataframe 列,如下所示。

df['lane']
AZ
NL

NaN
BL
AZ

我的代码

unique_lane = df['lane'].unique()
unique_lane = pd.DataFrame( list(zip(unique_lane)), columns =['unique_lane'])
t = ', '.join(unique_lane['unique_lane'].astype(str))

当我传递唯一列表值时,应从列表中删除空白('')或 Null 值。 创建的列表 t 不应包含空白或 Null 值。

bigdata_null_zones = bigdata_null_zones[~bigdata_null_zones["lane"].isin([t])]

如何在 python 中做到这一点?

来自问题的测试 DataFrame 的样本数据:

df = pd.DataFrame({'lane':['AZ','NL','', np.nan, 'BL','AZ']})

测试是否仅通过错误值或空字符串:

df = pd.DataFrame({'lane':['', np.nan]})
print (df)
  lane
0     
1  NaN

bigdata_null_zones = pd.DataFrame({'lane':['AZ','NL','AB', 'BL','AZ']})
print (bigdata_null_zones)
  lane
0   AZ
1   NL
2   AB
3   BL
4   AZ

删除后得到空Series

t = df['lane'].replace('',np.nan).dropna()
print (t)
Series([], Name: lane, dtype: float64)

所以如果通过得到相同的值,因为没有过滤:

bigdata_null_zones[bigdata_null_zones["lane"].isin(t)]
print (bigdata_null_zones)
  lane
0   AZ
1   NL
2   AB
3   BL
4   AZ

如果相同的 DataFrame:

df = pd.DataFrame({'lane':['AZ','NL','', np.nan, 'BL','AZ'],
                   'col':range(6)})

print (df)
  lane  col
0   AZ    0
1   NL    1
2         2
3  NaN    3
4   BL    4
5   AZ    5

df1 = df.assign(lane= df['lane'].replace('',np.nan)).dropna(subset=['lane'])
print (df1)
  lane  col
0   AZ    0
1   NL    1
4   BL    4
5   AZ    5

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM