繁体   English   中英

一列熊猫数据框丢失数据

[英]Missing data in a column of pandas dataframe

我正在创建一个名为“salesdata”的数据框,它有一个名为“Outlet_Size”的列,该列包含一些缺失的数据。这是我的代码-:

#defining a dictionary
cat_dict ={}
#getting all the values of the column
outlet_size_values = salesdata.Outlet_Size.values
unique_outlet_size_val = list(set(outlet_size_values))  
print(unique_outlet_size_val)

我得到的输出是 [nan,'High','Medium','Small'] 我不希望这个丢失的数据(nan)成为我列表的一部分,我不想创建一个新列表为了这。

使用基本的dropna函数: dropna删除 nan 值,然后使用unique来获得集合等效结果:

salesdata.Outlet_Size.dropna().unique()

pandas具有独特的功能来获取不同的值。 您可以使用它并过滤掉 NaN 之类的

salesdata.loc[~salesdata.Outlet_Size.isnull(), 'Outlet_Size'].unique()

您可以使用numpy.unique

import pandas as pd
import numpy as np

np.unique(salesdata.Outlet_Size.dropna().values)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM