如何在 R 中尽快将宽度为 2 的字符串拆分为数据帧的行

Question

我有以下 R 脚本

library(stringr)
library(tibble)
string <- "just_do_its"

string_to_df <- function(string){
  vector_a <- NULL
  for(i in 1:nchar(string)){
    s <- substring(string, i, i+1)
    vector_a[i] <- s
  }
  df_a <- tibble::enframe(vector_a[1:length(vector_a) - 1], name = NULL)
  return(df_a)
}

df_string <- string_to_df(string)

df_string

它返回以下数据框

> df_string
# A tibble: 10 x 1
   value
   <chr>
 1 ju
 2 us
 3 st
 4 t_
 5 _d
 6 do
 7 o_
 8 _i
 9 it
10 ts

我想知道是否有更有效的方法将字符串拆分为 2 成数据框的行。 结果应该与上面的 output 匹配。

另外，我听说向量化代码比 for 循环更有效。 如果是这种情况，可以做些什么来向量化这段代码？

Answer 1

substring是矢量化的，在基础 R 中可用。

ind = sequence(nchar(string))
data.frame(S = substring(text = string, first = head(ind, -1), last = tail(ind, -1)))
#OR in one line
data.frame(S = substring(string, 1:(nchar(string) - 1), 2:nchar(string)))
#    S
#1  ju
#2  us
#3  st
#4  t_
#5  _d
#6  do
#7  o_
#8  _i
#9  it
#10 ts

如何在 R 中尽快将宽度为 2 的字符串拆分为数据帧的行

问题描述

1 个解决方案

解决方案1
3 2019-10-01 20:31:32

如何在 R 中尽快将宽度为 2 的字符串拆分为数据帧的行

问题描述

1 个解决方案

解决方案1 3 2019-10-01 20:31:32

解决方案1
3 2019-10-01 20:31:32