簡體   English   中英

在Scala Spark中從數據框中的數據中刪除空格

[英]Removing spaces from data in a column of dataframe in scala spark

這是我用來刪除“。”的命令。 從火花標度的df列中的數據正常工作

rfm = rfm.select(regexp_replace(col("tagname"),"\\.","_") as "tagname",col("value"),col("sensor_timestamp")).persist()

但這無法刪除相同列數據中的前導空格

rfm = rfm.select(regexp_replace(col("tagname")," ","") as "tagname",col("value"),col("sensor_timestamp")).persist()

沒有錯誤。 它只是無法刪除我在數據中看到的任何前導空格

輸入:rfmshow()

+--------------------+-----+----------------+
|           tagname  |value|timestamp       |
+--------------------+-----+----------------+
|  P.A               |101.5|  1.409643313E12|
|  P.A               |100.5|  1.409643315E12|
|  P.A               |100.5|  1.409644709E12|
|P.B                 |  0.0|   1.40964471E12|

輸出:

    +--------------------+-----+----------------+
    |          tagname   |value|timestamp       |
    +--------------------+-----+----------------+
    |  P_A               |101.5|  1.409643313E12|
    |  P_A               |100.5|  1.409643315E12|
    |  P_A               |100.5|  1.409644709E12|
    |P_B                 |  0.0|   1.40964471E12|

您必須提供一種模式,而不僅僅是空間。 提供如下。

regexp_replace(col("tagname"),"\\s+"," ")

\\s+用於一個以上的空間,另外一個額外的\\用於轉義\\s內部方法中的\\s

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM