繁体   English   中英

在相等的列值上切片熊猫数据框

[英]Slicing pandas dataframe on equal column values

我有一个看起来像这样的熊猫 df:

import pandas as pd

df = pd.DataFrame({0:[1],5:[1],10:[1],15:[1],20:[0],25:[0],
                   30:[1],35:[1],40:[0],45:[0],50:[0]})
df

在此处输入图片说明

列名反映坐标。 我想检索具有连续相等数字的列的开始和结束坐标。

输出应该是这样的:

# start,end
0,15 
20,25
30,35
40,50

IIUCusing groupbydiffcumsum分裂组

s=df.T.reset_index()
s=s.groupby(s[0].diff().ne(0).cumsum())['index'].agg(['first','last'])
Out[241]: 
   first  last
0             
1      0    15
2     20    25
3     30    35
4     40    50

cumsum来识别 group 和groupby

s = df.iloc[0].diff().ne(0).cumsum()
(df.columns.to_series()
 .groupby(s).agg(['min','max'])
)

输出:

   min  max
0          
1    0   15
2   20   25
3   30   35
4   40   50

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM