簡體   English   中英

如何在多個 pandas 數據幀中編碼標簽?

[英]How to encode labels in multiple pandas dataframes?

我有 2 個數據框 df1 和 df2

兩者都有 3 列:

c1, c2, c3

但在 df1 的 c3 列中,我有這些獨特的標簽:

l1, l2, l3, l4

在 df2 的 c3 列中,我有這些獨特的標簽:

l2, l3, l4, l5

我想對這些標簽進行編碼,以便 df1 的最后一列值變成這樣:

1, 2, 3, 4

和df2:

2, 3, 4, 5

因此,兩個數據幀中的編碼標簽應該具有相同的名稱。 標簽不按順序排列。 不常見的標簽可能不止 1 個。

使用以下命令:

>>> df1
   c3
0  l1
1  l2
2  l3
3  l4
>>> df1["c3"].apply(lambda x: x[-1])
0    1
1    2
2    3
3    4

也將其應用於 df2:

>>> df1["c3"].apply(lambda x: x[-1])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM