簡體   English   中英

將每一行與所有其他行進行比較 pandas

[英]Comparing every row with all other rows with pandas

我的目標是將每一行與所有其他行進行比較,以查看有多少行的條目是唯一的。 我對 pandas 很陌生,所以我很茫然。 示例性的 dataframe 如下所示:

df = pd.DataFrame({"ID" : [1, 2, 3], 
                   "age": [46, 48, 55],
                   "gender": ['female', 'female', 'male']},
                   index = [0, 1, 2]) 

你到底想獲得什么?

如果您想知道每列有多少個唯一值,請使用nunique

df.nunique()

ID        3
age       3
gender    2
dtype: int64

如果您想知道有多少行(考慮列的組合),請使用duplicated

len(df) - df[['age', 'gender']].duplicated().sum()

# or 
(~df.drop(columns='ID').duplicated()).sum()

# or
(~df[['age', 'gender']].duplicated()).sum()

3

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM