繁体   English   中英

R-查找所有可能的组合分词

[英]R - Find all possible combinations splitted word

我有一个函数可以从字符串中提取所有有意义的单词。 在此之后,我想根据这些单词创建所有可能的句子。

例如:

MyString <- "temelproblem"

用我的函数分割后,我得到一个这样的数据框;

Data <- data.frame(
myword = c("te","tem","teme","temel","em","eme","emel","me","mel","el","pr","problem","em"),
start = c(1,  1,  1,  1,  2,  2,  2,  3,  3,  4,  6,  6, 11),
finish = c(2,  3,  4,  5,  3,  4,  5,  4,  5,  5,  7, 12, 12)
)

> Data
    myword start finish
1       te     1      2
2      tem     1      3
3     teme     1      4
4    temel     1      5
5       em     2      3
6      eme     2      4
7     emel     2      5
8       me     3      4
9      mel     3      5
10      el     4      5
11      pr     6      7
12 problem     6     12
13      em    11     12

我需要所有可能的组合,规则是; 下一个单词应在上一个单词结束后开始。 我从这个样本中得到了;

"tem" "el" "problem"
"temel" "problem"

我将非常感谢您提供指导思想...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM