[英]Comparing every row with all other rows with pandas
我的目標是將每一行與所有其他行進行比較,以查看有多少行的條目是唯一的。 我對 pandas 很陌生,所以我很茫然。 示例性的 dataframe 如下所示:
df = pd.DataFrame({"ID" : [1, 2, 3],
"age": [46, 48, 55],
"gender": ['female', 'female', 'male']},
index = [0, 1, 2])
你到底想獲得什么?
如果您想知道每列有多少個唯一值,請使用nunique
:
df.nunique()
ID 3
age 3
gender 2
dtype: int64
如果您想知道有多少行(考慮列的組合),請使用duplicated
:
len(df) - df[['age', 'gender']].duplicated().sum()
# or
(~df.drop(columns='ID').duplicated()).sum()
# or
(~df[['age', 'gender']].duplicated()).sum()
3
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.