![](/img/trans.png)
[英]How to replace values in multiple categoricals in a pandas DataFrame
[英]How to compare different categoricals in Pandas?
我想比較類別與值稍有不同的類別
cats1=pd.Categorical(["a", "b"])
cats2=pd.Categorical(["c", "b"])
cats1==cats2
這將引發錯誤,因為它們的值設置不相同。 它們來自不同的數據源,但是值大多相同。
我可以有效地比較它們而無需將整個列都轉換為字符串嗎?
如果以上比較有效,我需要布爾向量。
前面已經指出的那樣,你可以使用x.isin(y)
看看什么x
可以發現y
。 要確切了解它們有多少重疊,可以執行以下操作:
res = cats1.isin(cats2)
print(res.mean())
輸出:
0.5
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.