簡體   English   中英

在 \ 處而不是 \ 處拆分火花 dataframe 列,

[英]Split a spark dataframe column at , and not at \,

我有一個 spark 數據框,其中包含逗號 (,) 分隔的值並實現和轉義字符“,”我如何拆分該值而不在轉義字符處拆分?

您可以使用否定的后向正則表達式來轉義轉義的逗號:

df.show(truncate=False)
+------------------------------------------------------+
|value                                                 |
+------------------------------------------------------+
|value1,value2,value3,value4\,donot split,value5,value6|
+------------------------------------------------------+

df.select(F.split(F.col('value'), "(?<!\\\\),")).show(truncate=False)
+-------------------------------------------------------------+
|split(value, (?<!\\),, -1)                                   |
+-------------------------------------------------------------+
|[value1, value2, value3, value4\,donot split, value5, value6]|
+-------------------------------------------------------------+

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM