![](/img/trans.png)
[英]How to scale all columns except certain ones in pandas dataframe?
[英]How to delete all columns in DataFrame except certain ones?
假设我有一个如下所示的 DataFrame:
a b c d e f g
1 2 3 4 5 6 7
4 3 7 1 6 9 4
8 9 0 2 4 2 1
我 go 如何删除a
和b
以外的每一列?
这将导致:
a b
1 2
4 3
8 9
我想要一种使用简单的代码行删除这些列的方法,即删除a
和b
之外的所有列,因为假设我有 1000 列数据。
谢谢你。
In [48]: df.drop(df.columns.difference(['a','b']), 1, inplace=True)
Out[48]:
a b
0 1 2
1 4 3
2 8 9
或:
In [55]: df = df.loc[:, df.columns.intersection(['a','b'])]
In [56]: df
Out[56]:
a b
0 1 2
1 4 3
2 8 9
PS 请注意, @Wen 已经提出了最惯用的 Pandas 方法:
df = df[['a','b']]
或
df = df.loc[:, ['a','b']]
添加到组合中的另一种选择。 我更喜欢这种方法的可读性。
df = df.filter(['a', 'b'])
其中第一个位置参数是items=[]
您还可以使用like
参数或regex
进行过滤。
如果您有一组像['a_1','a_2','b_1','b_2']
你可以做
df = df.filter(like='b_')
并以['b_1','b_2']
结尾
有多种解决方案。
df = df[['a','b']] #1
df = df[list('ab')] #2
df = df.loc[:,df.columns.isin(['a','b'])] #3
df = pd.DataFrame(data=df.eval('a,b').T,columns=['a','b']) #4 PS:I do not recommend this method , but still a way to achieve this
如果您要删除多于两列,比如说20
或30
,您也可以使用列表。 确保您还指定了轴值。
drop_list = ["a","b"]
df = df.drop(df.columns.difference(drop_list), axis=1)
嘿,你要找的是:
df = df[["a","b"]]
您将收到一个 dataframe,其中仅包含 a 和 b 列
如果您只想保留多于您删除的列,请在 .isin 语句前添加“~”以选择除您想要的列之外的每一列:
df = df.loc[:, ~df.columns.isin(['a','b'])]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.