繁体   English   中英

拆分字符串、标记子字符串并将标记转换为数字向量

[英]Split a string, tokenize substrings, and convert tokens to numeric vectors

我有一个字符串:

String <- "268.1,271.1,280.9,294.7,285.6,288.6,384.4\n124.8,124.2,116.2,117.7,118.3,122.0,168.3\n18,18,18,18,18,18,18"

我想根据\n将它分成三个子字符串。

我使用以下代码做到了这一点:

strsplit(String, "\n")

它产生了三个子字符串。

  1. 如何获得三个独立的存在以便我可以使用每个向量进行计算?

  2. 如何标记子字符串以创建数值向量?

这是一种使用基础 R 的方法。 strsplit有点棘手,因为它返回一个列表并且也不适用于列表。

  1. 正如您在问题中建议的那样,将strsplitsplit = "\n"一起使用以拆分为 3 个字符串的列表。

  2. 使用unlist将该列表更改为 3 个字符串的向量。

  3. 再次使用strsplitsplit = ","创建一个包含 3 个字符向量的列表

  4. 使用lapply将这些字符向量转换为数值向量。

lapply(strsplit(unlist(strsplit(String,"\n")),","),as.numeric)
[[1]]
[1] 268.1 271.1 280.9 294.7 285.6 288.6 384.4

[[2]]
[1] 124.8 124.2 116.2 117.7 118.3 122.0 168.3

[[3]]
[1] 18 18 18 18 18 18 18

我们可以使用scan \n处拆分“字符串”后,遍历listscan字符串以将其作为vector读取

lapply(strsplit(String, "\n")[[1]], function(x) 
       scan(text = x, what = numeric(), sep=","))

或使用read.table (如最初所示)

read.table(text = String, sep=",")

如果元素数量不相等,请使用fill = TRUE

 read.table(text = String, sep=",", fill = TRUE)

原答案:

read.table(text = String, sep=",")
#    V1    V2    V3    V4    V5    V6    V7
#1 268.1 271.1 280.9 294.7 285.6 288.6 384.4
#2 124.8 124.2 116.2 117.7 118.3 122.0 168.3
#3  18.0  18.0  18.0  18.0  18.0  18.0  18.0
String<- "268.1,271.1,280.9,294.7,285.6,288.6,384.4\n124.8,124.2,116.2,117.7,118.3,122.0,168.3\n18,18,18,18,18,18,18"
   
string_vector <- unlist(strsplit(String, "\n"))

unlist(lapply(strsplit(string_vector, ','),as.numeric))

Output

 [1] 268.1 271.1 280.9 294.7 285.6 288.6 384.4 124.8 124.2 116.2 117.7 118.3 122.0 168.3  18.0  18.0  18.0  18.0  18.0  18.0
[21]  18.0

我们可以使用read.tableString读取为 dataframe ,分隔符为逗号( , ),这将自动使列数字化。

read.table(text = String, sep = ",")

#     V1    V2    V3    V4    V5    V6    V7
#1 268.1 271.1 280.9 294.7 285.6 288.6 384.4
#2 124.8 124.2 116.2 117.7 118.3 122.0 168.3
#3  18.0  18.0  18.0  18.0  18.0  18.0  18.0

然后我们可以使用asplit来拆分每一行的数据:

asplit(read.table(text = String, sep = ","), 1)

#[[1]]
#   V1    V2    V3    V4    V5    V6    V7 
#268.1 271.1 280.9 294.7 285.6 288.6 384.4 

#[[2]]
#   V1    V2    V3    V4    V5    V6    V7 
#124.8 124.2 116.2 117.7 118.3 122.0 168.3 

#[[3]]
#V1 V2 V3 V4 V5 V6 V7 
#18 18 18 18 18 18 18 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM