Pandas dataframe - 檢查多行是否具有相同的值

Question

我有一個 DataFrame，它看起來像這樣：

每個引用可以在 dataframe 中出現一次、兩次或三次； 並且可以關聯相同或不同的值。 我想創建另一個 dataframe，它告訴我，對於每個參考，它們是否都具有相同的值。 所以對於上面的例子，我想得到這樣的東西：

（我以是和否為例，但它可以是 1/0 或其他任何東西）

我怎樣才能做到這一點？

我最初的想法是使用.groupby但后來我沒有找到任何類型的聚合可以幫助我......

Answer 1

您可以使用groupby + nunique來計算每個引用的唯一值。 然后使用np.where根據唯一值的數量是否為 1 來分配是/否值：

out = df.groupby('Reference', as_index=False)['Value'].nunique()
out['Value'] = np.where(out['Value'].eq(1), 'Yes', 'No')

Output：

  Reference Value
0   String1   Yes
1   String2    No
2   String3    No