簡體   English   中英

一列熊貓數據框丟失數據

[英]Missing data in a column of pandas dataframe

我正在創建一個名為“salesdata”的數據框,它有一個名為“Outlet_Size”的列,該列包含一些缺失的數據。這是我的代碼-:

#defining a dictionary
cat_dict ={}
#getting all the values of the column
outlet_size_values = salesdata.Outlet_Size.values
unique_outlet_size_val = list(set(outlet_size_values))  
print(unique_outlet_size_val)

我得到的輸出是 [nan,'High','Medium','Small'] 我不希望這個丟失的數據(nan)成為我列表的一部分,我不想創建一個新列表為了這。

使用基本的dropna函數: dropna刪除 nan 值,然后使用unique來獲得集合等效結果:

salesdata.Outlet_Size.dropna().unique()

pandas具有獨特的功能來獲取不同的值。 您可以使用它並過濾掉 NaN 之類的

salesdata.loc[~salesdata.Outlet_Size.isnull(), 'Outlet_Size'].unique()

您可以使用numpy.unique

import pandas as pd
import numpy as np

np.unique(salesdata.Outlet_Size.dropna().values)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM