dataframe 中以時間戳為索引過濾相似行

Question

我有一個 dataframe 以時間戳為索引。 我想過濾掉具有相似時間戳的行並打印出來。 例如，

                        Value_1  Value_2
timestamp                                           
2022-03-22 17:31:02     23        30    
2022-03-22 17:31:02     25        40
2022-03-22 17:31:04     24        0.2   
2022-03-22 17:31:05     21        90    
2022-03-22 17:31:05     20        0.1

我想過濾掉具有類似時間戳的行，如下所示。

                        Value_1  Value_2
timestamp                                           
2022-03-22 17:31:02     23        30    
2022-03-22 17:31:02     25        40
2022-03-22 17:31:05     21        90    
2022-03-22 17:31:05     20        0.1

我嘗試使用melt和groupby 。 它沒有給我想要的結果。 有人可以幫我嗎？

謝謝。

Answer 1

我們可以使用帶有參數keep=False的index.duplicated （意思是如果存在重復值，則將所有出現的重復值標記為True ）

df[df.index.duplicated(keep=False)]

                     Value_1  Value_2
timestamp                            
2022-03-22 17:31:02       23     30.0
2022-03-22 17:31:02       25     40.0
2022-03-22 17:31:05       21     90.0
2022-03-22 17:31:05       20      0.1

Answer 2

您還可以使用groupby + filter ：

filtered_df = df.groupby(level=0).filter(lambda x: len(x) > 1)

Output：

>>> filtered_df
                     Value_1  Value_2
timestamp                            
2022-03-22 17:31:02       23     30.0
2022-03-22 17:31:02       25     40.0
2022-03-22 17:31:05       21     90.0
2022-03-22 17:31:05       20      0.1

dataframe 中以時間戳為索引過濾相似行

問題描述

2 個解決方案

解決方案1
2 已采納 2022-03-22 16:32:26

解決方案2
0

dataframe 中以時間戳為索引過濾相似行

問題描述

2 個解決方案

解決方案1 2 已采納 2022-03-22 16:32:26

解決方案2 0

解決方案1
2 已采納 2022-03-22 16:32:26

解決方案2
0