如何在R中标记字符串？

Question

I am trying to calculate readability, but it seems everything is written to expect either a file path or a Corpus. 我正在尝试计算可读性，但似乎所有内容都是为了期望文件路径或语料库。 How do I handle a string? 我该如何处理字符串？

Error (on the tokenization step): 错误（在标记化步骤中）：

Error: Unable to locate

I tried: 我试过了：

str<-"Readability zero one.  Ten, Eleven.", "The cat in a dilapidated tophat."
library(koRpus)
ll.tagged <- tokenize(str, lang="en")
readability(ll.tagged,measure="Flesch.Kincaid")

Answer 1

You need to download the language file 您需要下载语言文件

install.koRpus.lang(c("en"))
library(koRpus.lang.en)
ll.tagged <- tokenize(str,  format = "obj", lang = "en")
ll.tagged
   doc_id       token      tag lemma lttr   wclass desc stop stem idx sntc
1    <NA> Readability word.kRp         11     word <NA> <NA> <NA>   1    1
2    <NA>        zero word.kRp          4     word <NA> <NA> <NA>   2    1
3    <NA>         one word.kRp          3     word <NA> <NA> <NA>   3    1
4    <NA>           .     .kRp          1 fullstop <NA> <NA> <NA>   4    1
5    <NA>         Ten word.kRp          3     word <NA> <NA> <NA>   5    2
6    <NA>           ,     ,kRp          1    comma <NA> <NA> <NA>   6    2
                                             [...]                        
10   <NA>         cat word.kRp          3     word <NA> <NA> <NA>  10    3
11   <NA>          in word.kRp          2     word <NA> <NA> <NA>  11    3
12   <NA>           a word.kRp          1     word <NA> <NA> <NA>  12    3
13   <NA> dilapidated word.kRp         11     word <NA> <NA> <NA>  13    3
14   <NA>      tophat word.kRp          6     word <NA> <NA> <NA>  14    3
15   <NA>           .     .kRp          1 fullstop <NA> <NA> <NA>  15    3

如何在R中标记字符串？

问题描述

1 个解决方案

解决方案1
0 已采纳 2019-03-23 19:44:15

如何在R中标记字符串？

问题描述

1 个解决方案

解决方案1 0 已采纳 2019-03-23 19:44:15

解决方案1
0 已采纳 2019-03-23 19:44:15