熊猫dropna系列

Question

我有一个熊猫表df：

so the df is:

Item    | Category | Price
SKU123  | CatA     | 4.5
SKU124  | CatB     | 4.7
SKU124  | CatB     | 4.7
SKU125  | CatA     | NaN
SKU126  | CatB     | NaN
SKU127  | CatC     | 4.5

这是发电机

df = pd.DataFrame({'sku': ('SKU123', 'SKU124', 'SKU124', 'SKU125', 'SKU126', 'SKU127'), 'Cat':('CatA', 'CatB', 'CatB', 'CatA', 'CatB', 'CatC'), 'Price':(4.5, 4.7, 4.7, '', '', 4.5)})

我正在尝试使用NaN删除任何内容。

所以我进入

filtered_df = df.drop_duplicates
filtered_df['Price'].dropna(inplace=True)

我收到此错误：

TypeError: 'instancemethod' object has no attribute '__getitem__'

我想要的结果是：

Item    | Category | Price
SKU123  | CatA     | 4.5
SKU124  | CatB     | 4.7
SKU127  | CatC     | 4.5

Answer 1

您的代码的基本问题所在-

filtered_df = df.drop_duplicates

DataFrame.drop_duplicates是一个方法，您需要调用它。

另外，另一个问题是， filtered_df['Price'].dropna(inplace=True)不会执行您想要的操作，因为即使从系列中删除了值，由于索引存在于数据帧中，它也会再次提出系列中的NaN值。

您可以改为基于filtered_df['Price']系列的非空值进行布尔索引。 范例-

filtered_df = df.drop_duplicates()
filtered_df = filtered_df[filtered_df['Price'].notnull()]

但请注意，在您创建数据框的示例中，值是空字符串- '' -而不是NaN 。 如果你控制你如何创建数据框，你应该考虑使用None ，而不是'' 。

但是，如果空字符串来自其他地方，则可以在索引时使用Series.convert_objects方法将其转换为NaN 。 范例-

filtered_df = filtered_df[filtered_df['Price'].convert_objects(convert_numeric=True).notnull()]

演示-

In [42]: df = pd.DataFrame({'sku': ('SKU123', 'SKU124', 'SKU124', 'SKU125', 'SKU126', 'SKU127'), 'Cat':('CatA', 'CatB', 'CatB', 'CatA', 'CatB', 'CatC'), 'Price':(4.5, 4.7, 4.7, '', '', 4.5)})

In [43]: filtered_df = df.drop_duplicates()

In [44]: filtered_df = filtered_df[filtered_df['Price'].convert_objects(convert_numeric=True).notnull()]

In [45]: filtered_df
Out[45]:
    Cat Price     sku
0  CatA   4.5  SKU123
1  CatB   4.7  SKU124
5  CatC   4.5  SKU127

熊猫dropna系列

问题描述

1 个解决方案

解决方案1
1 已采纳 2015-10-14 06:55:39

熊猫dropna系列

问题描述

1 个解决方案

解决方案1 1 已采纳 2015-10-14 06:55:39

解决方案1
1 已采纳 2015-10-14 06:55:39