[英]Removing spaces from data in a column of dataframe in scala spark
這是我用來刪除“。”的命令。 從火花標度的df列中的數據正常工作
rfm = rfm.select(regexp_replace(col("tagname"),"\\.","_") as "tagname",col("value"),col("sensor_timestamp")).persist()
但這無法刪除相同列數據中的前導空格
rfm = rfm.select(regexp_replace(col("tagname")," ","") as "tagname",col("value"),col("sensor_timestamp")).persist()
沒有錯誤。 它只是無法刪除我在數據中看到的任何前導空格
輸入:rfmshow()
+--------------------+-----+----------------+
| tagname |value|timestamp |
+--------------------+-----+----------------+
| P.A |101.5| 1.409643313E12|
| P.A |100.5| 1.409643315E12|
| P.A |100.5| 1.409644709E12|
|P.B | 0.0| 1.40964471E12|
輸出:
+--------------------+-----+----------------+
| tagname |value|timestamp |
+--------------------+-----+----------------+
| P_A |101.5| 1.409643313E12|
| P_A |100.5| 1.409643315E12|
| P_A |100.5| 1.409644709E12|
|P_B | 0.0| 1.40964471E12|
您必須提供一種模式,而不僅僅是空間。 提供如下。
regexp_replace(col("tagname"),"\\s+"," ")
\\s+
用於一個以上的空間,另外一個額外的\\
用於轉義\\s
內部方法中的\\s
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.