大熊貓：根據最后一行的值刪除列

Question

從這樣的數據開始：

np.random.seed(314)
df = pd.DataFrame({
        'date':[pd.date_range('2016-04-01', '2016-04-05')[r] for r in np.random.randint(0,5,20)], 
        'cat':['ABCD'[r] for r in np.random.randint(0,4,20)], 
        'count': np.random.randint(0,100,20)
})

   cat  count       date
0    B     84 2016-04-04
1    A     95 2016-04-05
2    D     89 2016-04-02
3    D     39 2016-04-05
4    A     39 2016-04-01
5    C     61 2016-04-05
6    C     58 2016-04-04
7    B     49 2016-04-03
8    D     20 2016-04-02
9    B     54 2016-04-01
10   B     87 2016-04-01
11   D     36 2016-04-05
12   C     13 2016-04-05
13   A     79 2016-04-04
14   B     91 2016-04-03
15   C     83 2016-04-05
16   C     85 2016-04-05
17   D     93 2016-04-01
18   C     32 2016-04-02
19   B     29 2016-04-03

接下來，我按date計算總計，將cat旋轉到各列，並計算各列的運行總計：

summary = df.groupby(['date','cat']).sum().unstack().fillna(0).cumsum()

cat            A    B    C   D
date
2016-04-01    80  235   99   0
2016-04-02    85  295  153  14
2016-04-03   111  363  224  14
2016-04-04   111  379  296  50
2016-04-05   111  511  296  50

現在，我要刪除最后一列小於某個值（例如150）的列。結果應如下所示：

cat          B    C 
date
2016-04-01   235   99 
2016-04-02   295  153 
2016-04-03   363  224 
2016-04-04   379  296 
2016-04-05   511  296

我已經弄清楚了一部分：

mask = summary[-1:].squeeze() > 150


       cat
count  A      False
       B       True
       C       True
       D      False

會給我一個掩蓋掉欄的面具。 我不知道的是如何在調用summary.drop(...)使用它。 有什么提示嗎？

Answer 1

除了刪除不需要的列之外，還可以選擇想要的列（使用帶布爾索引的掩碼）：

In [16]: mask = summary[-1:].squeeze() > 220

In [17]: summary.loc[:, mask]
Out[17]:
            count
cat             B      D
date
2016-04-01  141.0   94.0
2016-04-02  235.0   94.0
2016-04-03  235.0  144.0
2016-04-04  326.0  144.0
2016-04-05  384.0  229.0

（我使用220而不是150，否則選擇了所有列）

此外，計算掩碼的更好方法可能是：

mask = summary.iloc[-1] > 220

它僅選擇最后一行（按位置），而不使用擠壓。

大熊貓：根據最后一行的值刪除列

問題描述

1 個解決方案

解決方案1
3 已采納 2016-05-02 21:50:08

大熊貓：根據最后一行的值刪除列

問題描述

1 個解決方案

解決方案1 3 已采納 2016-05-02 21:50:08

解決方案1
3 已采納 2016-05-02 21:50:08