[英]How to encode labels in multiple pandas dataframes?
我有 2 个数据框 df1 和 df2
两者都有 3 列:
c1, c2, c3
但在 df1 的 c3 列中,我有这些独特的标签:
l1, l2, l3, l4
在 df2 的 c3 列中,我有这些独特的标签:
l2, l3, l4, l5
我想对这些标签进行编码,以便 df1 的最后一列值变成这样:
1, 2, 3, 4
和df2:
2, 3, 4, 5
因此,两个数据帧中的编码标签应该具有相同的名称。 标签不按顺序排列。 不常见的标签可能不止 1 个。
使用以下命令:
>>> df1
c3
0 l1
1 l2
2 l3
3 l4
>>> df1["c3"].apply(lambda x: x[-1])
0 1
1 2
2 3
3 4
也将其应用于 df2:
>>> df1["c3"].apply(lambda x: x[-1])
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.