[英]How to encode labels in multiple pandas dataframes?
我有 2 個數據框 df1 和 df2
兩者都有 3 列:
c1, c2, c3
但在 df1 的 c3 列中,我有這些獨特的標簽:
l1, l2, l3, l4
在 df2 的 c3 列中,我有這些獨特的標簽:
l2, l3, l4, l5
我想對這些標簽進行編碼,以便 df1 的最后一列值變成這樣:
1, 2, 3, 4
和df2:
2, 3, 4, 5
因此,兩個數據幀中的編碼標簽應該具有相同的名稱。 標簽不按順序排列。 不常見的標簽可能不止 1 個。
使用以下命令:
>>> df1
c3
0 l1
1 l2
2 l3
3 l4
>>> df1["c3"].apply(lambda x: x[-1])
0 1
1 2
2 3
3 4
也將其應用於 df2:
>>> df1["c3"].apply(lambda x: x[-1])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.