Python：從數據框中選擇多個相似的列

Question

我有一個數據框：

df:

    a21   b21   c21  a22   b22  a23  b23
1    2    2      2    4     5    7    7
2    2    2      2    4     5    7    7
3    2    2      2    4     5    7    7
4    2    2      2    4     5    7    7
5    2    2      2    4     5    7    7

我只想選擇具有'21'和'23'列，這樣我的輸出是：

df_output:

    a21   b21   c21   a23  b23
1    2    2      2     7    7
2    2    2      2     7    7
3    2    2      2     7    7
4    2    2      2     7    7
5    2    2      2     7    7

我可以使用以下代碼執行此操作：

df_21 = (df.loc[:, df.filter(like='21').columns])    
df_23 = (df.loc[:, df.filter(like='23').columns])

然后，我可以合並df_21和df_23但是是否有一種有效的方法可以在一行代碼中執行相同的操作？

Answer 1

我們可以使用DataFrame.filter（）方法：

In [38]: df.filter(regex=r'21|23')
Out[38]:
   a21  b21  c21  a23  b23
1    2    2    2    7    7
2    2    2    2    7    7
3    2    2    2    7    7
4    2    2    2    7    7
5    2    2    2    7    7

要么：

In [45]: df.loc[:, df.columns.str.contains(r'21|23')]
Out[45]:
   a21  b21  c21  a23  b23
1    2    2    2    7    7
2    2    2    2    7    7
3    2    2    2    7    7
4    2    2    2    7    7
5    2    2    2    7    7

Answer 2

您可以使用條件列表理解：

targets = ['21', '23']
df[[col for col in df if any(target in col for target in targets)]]

Python：從數據框中選擇多個相似的列

問題描述

2 個解決方案

解決方案1
2 已采納 2017-08-01 20:28:05

解決方案2
0 2017-08-01 20:31:07

Python：從數據框中選擇多個相似的列

問題描述

2 個解決方案

解決方案1 2 已采納 2017-08-01 20:28:05

解決方案2 0 2017-08-01 20:31:07

解決方案1
2 已采納 2017-08-01 20:28:05

解決方案2
0 2017-08-01 20:31:07