繁体   English   中英

R:从数据框中的文本字符串中删除隐藏的换行符

[英]R: remove hidden line break characters from text strings within a data frame

我发现数据框内的某些字符串包含隐藏的换行符,尽管我无法确切分辨出哪一个(当装入gVim时,它们只是显示为换行符)。 如下代码:

gsub(“ [\\ r \\ n]”,“”,x)

成功删除了字符串中的换行符。 但是,它也消除了分隔单元格的换行符,使我的数据帧具有原子性,而不是递归的。 在保持数据框完整的同时,如何只定位字符串中的换行符?

这是数据示例:

样本数据框

复制上面的评论以结束问题,

dataframe <- data.frame(ID = 1:2, Name = 'XX',
  string_column = c('Hi \r\nyou\r\n', 'Always \r\nshare\r\n some \r\nsample\r\n data!'))
  dataframe$string_column  
#> [1] Hi \r\nyou\r\n                                
#> [2] Always \r\nshare\r\n some \r\nsample\r\n data!
#> Levels: Always \r\nshare\r\n some \r\nsample\r\n data! Hi \r\nyou\r\n

dataframe$string_column <- sapply(dataframe$string_column,
                                    function(x) { gsub("[\r\n]", "", x) })
dataframe$string_column
#> [1] "Hi you"                         "Always share some sample data!"

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM