簡體   English   中英

如何將數據幀的每一行與數據幀的所有行進行比較?

[英]How to compare each row of a data frame with all rows of the data frame?

我的數據框僅由一列組成,每一行都是一個列表。 我想將每一行與其他所有行進行比較,以查找每個列表在該列中是否有任何子集,並且我想打印這些子集。 您能為此建議代碼嗎?

我假設索引是從0到N的數字,並且您正在使用熊貓。 如果不是這種情況,請將df.drop行編輯為df.drop(df [item])。 我將每一行存儲到一個變量中,然后刪除該行以對該行與整個數據框進行比較。 在給定的示例中,我正在數據框中使用一列(“標識符”)來檢查我感興趣的行與所有其他行之間的相似性。 您可以在從數據框中拆分行后插入自己的邏輯。 我希望這有幫助。

for item in range(len(df)):
    ## Split Row from Dataframe
    row_of_interest = df.iloc[item]
    df_without_row = df.drop(item)
    ## Perform Comparison of Row Characterisitics 
    ## Identifier is a column that I want to compare
    for j in range(len(df_without_row)):
        if df_without_row.iloc[j]["Identifier"] == row_of_interest["Identifier"]:
            do something ...

    ## Keep Row of interest or other rows

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM