簡體   English   中英

R:從數據框中的文本字符串中刪除隱藏的換行符

[英]R: remove hidden line break characters from text strings within a data frame

我發現數據框內的某些字符串包含隱藏的換行符,盡管我無法確切分辨出哪一個(當裝入gVim時,它們只是顯示為換行符)。 如下代碼:

gsub(“ [\\ r \\ n]”,“”,x)

成功刪除了字符串中的換行符。 但是,它也消除了分隔單元格的換行符,使我的數據幀具有原子性,而不是遞歸的。 在保持數據框完整的同時,如何只定位字符串中的換行符?

這是數據示例:

樣本數據框

復制上面的評論以結束問題,

dataframe <- data.frame(ID = 1:2, Name = 'XX',
  string_column = c('Hi \r\nyou\r\n', 'Always \r\nshare\r\n some \r\nsample\r\n data!'))
  dataframe$string_column  
#> [1] Hi \r\nyou\r\n                                
#> [2] Always \r\nshare\r\n some \r\nsample\r\n data!
#> Levels: Always \r\nshare\r\n some \r\nsample\r\n data! Hi \r\nyou\r\n

dataframe$string_column <- sapply(dataframe$string_column,
                                    function(x) { gsub("[\r\n]", "", x) })
dataframe$string_column
#> [1] "Hi you"                         "Always share some sample data!"

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM