有没有办法在数据帧的特定列中添加 0 以匹配特定的位数？

Question

我有两个表，其中一列包含特定 ID。

例如，

表A

表B

我正在尝试使用 sql 应用内连接，但由于它们不完全匹配，因此使用内连接子句的结果中缺少前两个 ID 1234 (0001234)、32145 (0032145)。

所以这是我的问题。

有没有办法在表 A 的 cust_id 前面添加额外的 0 以匹配表 B 的 cust_id？

比如1234只有4位，但是转换后变成了7位，前面加了三个0 --> 0001234。

使用 Python 是否更容易处理这些类型的任务？ 或SQL？ 我过去在数据清理方面的经验告诉我它是 Python，但还有其他建议吗？

如果可能的话，对于这种特定情况，我希望我可以使用 Python 或 SQL 获得帮助。

提前致谢。

Answer 1

对于python，这可以使用pandas 轻松处理。

假设 cust_id 已经是一个字符串列：

>>> df.cust_id.apply(lambda x: x.zfill(7))
0    0001234
1    0032145
2    1235692
3    9293159

对于 SQL，您声明您使用的是 SSMS，因此这意味着 SQL Server。 不幸的是，SQL Server 没有开箱即用的 LPAD 功能，但您可以使用以下方法复制它：

REPLACE(STR(<column_name>, <desired_length>),' ','0')

例如：

with cust_ids as (
    select * from (
        values 
            ('1234'),
            ('32145'),
            ('1235692'),
            ('9293159')
        ) a (cust_id)
)

select 
    cust_id,
    REPLACE(STR(cust_id, 7),' ','0') as padded_cust_id
from cust_ids

有没有办法在数据帧的特定列中添加 0 以匹配特定的位数？

问题描述

1 个解决方案

解决方案1
0 2021-07-15 10:27:35

有没有办法在数据帧的特定列中添加 0 以匹配特定的位数？

问题描述

1 个解决方案

解决方案1 0 2021-07-15 10:27:35

解决方案1
0 2021-07-15 10:27:35