根據條件在熊貓數據框中刪除列

Question

假設我有以下數據框：

+---+---------+------+------+------+
|   | summary | col1 | col2 | col3 |
+---+---------+------+------+------+
| 0 | count   | 10   | 10   | 10   |
+---+---------+------+------+------+
| 1 | mean    | 4    | 5    | 5    |
+---+---------+------+------+------+
| 2 | stddev  | 3    | 3    | 3    |
+---+---------+------+------+------+
| 3 | min     | 0    | -1   | 5    |
+---+---------+------+------+------+
| 4 | max     | 100  | 56   | 47   |
+---+---------+------+------+------+

如何僅保留count > 5 ， mean>4和min>0的列以及列summary ？

所需的輸出是：

+---+---------+------+
|   | summary | col3 |
+---+---------+------+
| 0 | count   | 10   |
+---+---------+------+
| 1 | mean    | 5    |
+---+---------+------+
| 2 | stddev  | 3    |
+---+---------+------+
| 3 | min     | 5    |
+---+---------+------+
| 4 | max     | 47   | 
+---+---------+------+

Answer 1

你需要：

df2 = df.set_index('summary').T
m1 = df2['count'] > 5
m2 = df2['mean'] > 4
m3 = df2['min'] > 0
df2.loc[m1 & m2 & m3].T.reset_index()

輸出：

    summary col3
0   count   10
1   mean    5
2   stddev  3
3   min     5
4   max     47

注意：您可以直接在.loc[]輕松使用條件，但是當我們有多個條件時，最好使用單獨的掩碼變量（ m1 ， m2 ， m3 ）

Answer 2

loc與可調用。

(df.set_index('summary').T
   .loc[lambda x: (x['count'] > 5) & (x['mean'] > 4) & (x['min'] > 0)]
   .T.reset_index())

Answer 3

這是一種方法

s=df.set_index('summary')
com=pd.Series([5,4,0],index=['count','mean','min'])
idx=s.loc[com.index].gt(com,axis=0).all().loc[lambda x : x].index
s[idx]
Out[142]: 
         col3
summary      
count      10
mean        5
stddev      3
min         5
max        47

Answer 4

關於plus `query`一般`query`

(
    df.set_index('summary')
      .rename(str.title).T
      .query('Count > 5 & Mean > 4 and Min > 0')
      .T.rename(str.lower)
      .reset_index()
)

  summary  col3
0   count    10
1    mean     5
2  stddev     3
3     min     5
4     max    47

雪茄

(
    df[['summary']].join(
        df.iloc[:, 1:].loc[:, df.iloc[[0, 1, 3], 1:].T.gt([5, 4, 0]).all(1)]
    )
)
  summary  col3
0   count    10
1    mean     5
2  stddev     3
3     min     5
4     max    47

Answer 5

將summary列設置為索引，然后執行以下操作：

df.T.query("(count > 5) & (mean > 4) & (min > 0)").T

根據條件在熊貓數據框中刪除列

問題描述

5 個解決方案

解決方案1
3 已采納 2019-08-12 16:02:28

解決方案2
2 2019-08-12 16:12:58

解決方案3
1 2019-08-12 16:04:10

解決方案4
1 2019-08-12 16:14:21

關於plus `query`一般`query`

雪茄

解決方案5
0 2019-08-12 16:04:54

根據條件在熊貓數據框中刪除列

問題描述

5 個解決方案

解決方案1 3 已采納 2019-08-12 16:02:28

解決方案2 2 2019-08-12 16:12:58

解決方案3 1 2019-08-12 16:04:10

解決方案4 1 2019-08-12 16:14:21

關於plus query一般query

雪茄

解決方案5 0 2019-08-12 16:04:54

解決方案1
3 已采納 2019-08-12 16:02:28

解決方案2
2 2019-08-12 16:12:58

解決方案3
1 2019-08-12 16:04:10

解決方案4
1 2019-08-12 16:14:21

關於plus `query`一般`query`

解決方案5
0 2019-08-12 16:04:54