删除序列号中的前导零或外来字符

Question

例如：在下面的“示例”列中，我需要删除第 2、3 和 5 列，因为它们要么在开头有前导零，要么在开头有特殊字符。

我尝试将“示例”列数据类型更改为字符串并像这样提取第一个字符：

t = df['Sample'].astype(str).str[0].astype(int)

但它给了我这个 output：

print(t)

 
|   1   |  1  | 
|   2   |  1  | 
|   3   |  9  | 
|   4   |  3  |
|   5   |  0  |

它想要这样，以便我可以使用索引值删除相应的行：

 
|   1   |  1  | 
|   2   |  0  | 
|   3   |  0  | 
|   4   |  3  |
|   5   |  .  |

我的方法正确吗？ 有人可以帮我解决这个问题吗？ 非常感谢。

Answer 1

您可以尝试使用str.match如下：

df = df[df["sample"].str.match(r'[1-9]')]

这只会保留样本值以数字开头的行，而不是零。