删除线性增加的“计数”列熊猫

Question

I have a dataframe with some columns representing counts for every timestep, I would like to automatically drop these, for example like the df.dropna() functionality, but something like df.dropcounts() . 我有一个数据框，其中的某些列表示每个时间步长的计数，我想自动删除这些计数，例如df.dropna()功能，但类似df.dropcounts() 。

Here is an example dataframe 这是一个示例数据框

array = [[0.0,1.6,2.7,12.0],[1.0,3.5,4.5,13.0],[2.0,6.5,8.6,14.0]]
pd.DataFrame(array)

     0    1    2     3
0  0.0  1.6  2.7  12.0
1  1.0  3.5  4.5  13.0
2  2.0  6.5  8.6  14.0

I would like to drop the first and last columns 我想删除第一列和最后一列

Answer 1

I believe need: 我相信需要：

val = 1
df = df.loc[:, df.diff().fillna(val).ne(val).any()]
print (df)
     1    2
0  1.6  2.7
1  3.5  4.5
2  6.5  8.6

Explanation : 说明：

First compare by DataFrame.diff : 首先通过DataFrame.diff比较：

print (df.diff())
     0    1    2    3
0  NaN  NaN  NaN  NaN
1  1.0  1.9  1.8  1.0
2  1.0  3.0  4.1  1.0

Replace NaN s: 替换NaN ：

print (df.diff().fillna(val))
     0    1    2    3
0  1.0  1.0  1.0  1.0
1  1.0  1.9  1.8  1.0
2  1.0  3.0  4.1  1.0

Compare if not equal by ne : 如果不相等比较ne ：

print (df.diff().fillna(val).ne(val))
       0      1      2      3
0  False  False  False  False
1  False   True   True  False
2  False   True   True  False

And chck at least one True per column by DataFrame.any : 并且通过DataFrame.any每列至少一个True ：

print (df.diff().fillna(val).ne(val).any())
0    False
1     True
2     True
3    False
dtype: bool

Answer 2

Using all all使用

d.loc[:,~d.diff().fillna(1).eq(1).all().values]
Out[295]: 
     1    2
0  1.6  2.7
1  3.5  4.5
2  6.5  8.6

删除线性增加的“计数”列熊猫

问题描述

2 个解决方案

解决方案1
1 已采纳 2018-04-23 14:42:14

解决方案2
1 2018-04-23 14:46:42

删除线性增加的“计数”列熊猫

问题描述

2 个解决方案

解决方案1 1 已采纳 2018-04-23 14:42:14

解决方案2 1 2018-04-23 14:46:42

解决方案1
1 已采纳 2018-04-23 14:42:14

解决方案2
1 2018-04-23 14:46:42