如何根据列中的唯一值最好地遍历 DataFrame 上的行？

Question

我有一个包含大约 60K 行的价目表，其中包含大约 5.5K 种服务持续时间不同的产品。 简化后看起来像这样：

dpl_Description w/o months  dpl_Order Duration
X                           36
X                            9
Y                           23
F                           26
F                            7
F                           18
X                            6
X                            4
X                           15
Z                           35
Z                            6
Z                            5
C                            3
X                           34
Y                           12
Y                            5

（关于该主题：有没有更好的方式来张贴表格？）

如果存在 12 个月的项目，我想查看此列表，并删除持续时间不是 12、24 或 36 个月的任何产品（如果此特定产品不能作为 12 个月的项目提供，则所有项目都应保留）。

这是我当前用于实现此目的的代码：

for pwl in pd.unique(result["dpl_Description w/o months"]):
if result[(result["dpl_Description w/o months"] == pwl) & (result["dpl_Order Duration"] == 12)].empty:
    pass
else:
    for i in result[(result["dpl_Description w/o months"] == pwl) & (result["Charity"] != "Yes")]["dpl_Order Duration"]:
        if i in [12, 24, 36]:

        else:
            result.drop(result[(result["dpl_Description w/o months"] == pwl) & (result["dpl_Order Duration"] == i)].index, inplace=True)

代码运行完成了我想要的，但速度非常慢。 鉴于我计划围绕它编写一个函数，并将这种相同的方法用于需要在数据集上完成的各种其他操作，我想获得一些反馈。

解决这个问题的更好方法是什么，从而导致更省时的计算？

编辑我已经尝试了以下希望加速代码，因为这应该避免在各个持续时间中进行大部分循环。 但是，它仍然运行得很慢：

for pwl in pd.unique(result["dpl_Description w/o months"]):
if result[(result["dpl_Description w/o months"] == pwl) & (result["dpl_Order Duration"] == 12)].empty:
    pass
else:
     result.drop(result[~(result["dpl_Order Duration"].isin([12,24,36])) & (result["Charity"] != "Yes") & (result["dpl_Description w/o months"] == pwl)].index, inplace=True)

2. 编辑

根据提供的示例数据集，我期望的输出是：

X 36
X 9
F 26
F 7
F 18
X 6
X 4
X 15
Z 35
Z 6
Z 5
C 3
Y 12

如上所述，如果相同的产品也在价目表中作为 12 个月的项目，我只想删除非 12,24 或 36 行。 在这种情况下，这只适用于产品“Y”。

Answer 1

没有预期的输出，我猜测

df = df[df['dpl_Order Duration'].isin([12, 24, 36])]

   dpl_Description w/o months  dpl_Order Duration
0                           X                  36
14                          Y                  12

如何根据列中的唯一值最好地遍历 DataFrame 上的行？

问题描述

1 个解决方案

解决方案1
0 2020-01-09 15:00:06

如何根据列中的唯一值最好地遍历 DataFrame 上的行？

问题描述

1 个解决方案

解决方案1 0 2020-01-09 15:00:06

解决方案1
0 2020-01-09 15:00:06