![](/img/trans.png)
[英]Efficient way to check if 2 columns of DataFrame are subsets of each other
[英]Looking for a way to remove subsets from columns in dataframe
我有一個 dataframe 格式如下 -
'''
ids size
[A, B, C, D, E, F] 100
[C,D,E] 50
[C,D,E,F,G] 200
[D,E,F,G,H] 190
[E,F,G,H] 100
[K, L, M, N] 200
'''
這個 dataframe 有數千行和眾多的 ID 組合。 處理列表有點痛苦。 我可以使用 issubset 刪除 [C, D, E] 條目
我想做的是保留具有最大尺寸的唯一 id 分組(在這種情況下,C、D、E、F、G)。 因為其他條目共同的最大的一個,我對那些不感興趣。 唯一應該存活的是 C、D、E、F、G 和 K、L、M、N。有沒有辦法在 Pandas 中處理這個問題?
我不確定你到底想要什么,但你可以過濾一些最小值
minimumVal = 195
df = df[df['ids'] > minimumVal]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.