[英]How to remove - from values in a field- python or pyspark
我有一個看起來像的字段
field1
231-206-2222
231-206-2344
231-206-1111
231-206-1111
我嘗試對其進行正則表達式,但無濟於事。 我是新手,所以任何想法都會有所幫助。 有什么建議嗎? 我是新手,所以任何想法都會有所幫助。 有什么建議嗎? 我是新手,所以任何想法都會有所幫助。 有什么建議嗎?
對我來說似乎是 dataframe,如果是這樣試試這個:
df['field1'].apply(lambda x: x.replace("-",""))
有很多方法可以做到這一點。
演示:
1) # where sub 將用空格替換連字符
df = pd.DataFrame({'field1': ['123-456-999', '333-222-111']})
df['field1'] = df['field1'].apply(lambda x: re.sub(r'-', '', x))
2) # 其中 \D+ 將匹配一個或多個非數字並將其刪除
df['field1'] = df['field1'].str.replace(r'\D+', '')
3) # 用空格替換 -
df['field1'] = df['field1'].str.replace('-', '')
結果:
field1
0 123456999
1 333222111
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.