簡體   English   中英

尋找從 dataframe 中的列中刪除子集的方法

[英]Looking for a way to remove subsets from columns in dataframe

我有一個 dataframe 格式如下 -

'''
ids                        size
[A, B, C, D, E, F]         100
[C,D,E]                     50 
[C,D,E,F,G]                200
[D,E,F,G,H]                190
[E,F,G,H]                  100
[K, L, M, N]               200
'''

這個 dataframe 有數千行和眾多的 ID 組合。 處理列表有點痛苦。 我可以使用 issubset 刪除 [C, D, E] 條目

我想做的是保留具有最大尺寸的唯一 id 分組(在這種情況下,C、D、E、F、G)。 因為其他條目共同的最大的一個,我對那些不感興趣。 唯一應該存活的是 C、D、E、F、G 和 K、L、M、N。有沒有辦法在 Pandas 中處理這個問題?

我不確定你到底想要什么,但你可以過濾一些最小值

    minimumVal = 195
    df = df[df['ids'] > minimumVal]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM