簡體   English   中英

R:使用 TermDocumentMatrix 保持大寫

[英]R: Keep Upper Case with TermDocumentMatrix

我想用wordcloud package 創建一個 wordcloud。 我的問題是我想在單詞的開頭保留大寫,但所有字母都會自動轉換為小寫。

據我所知,當我使用TermDocumentMatrix function 時會發生這種情況。 是否有可能阻止 function 將所有字母轉換為小寫?

您可以通過在控制列表中指定tolower=FALSE來阻止TermDocumentMatrix將所有內容轉換為小寫。 由於您沒有提供任何數據,我將使用 tm package 中提供的示例數據進行說明。

library(wordcloud)
library(tm)
data(crude)

tdm = TermDocumentMatrix(crude, 
    control=list(removePunctuation=T, tolower=F, stopwords=T))
WordFreq = slam::row_sums(tdm[tdm$dimnames$Terms, ])
FrequentWords = tail(sort(WordFreq), 20)
wordcloud(names(FrequentWords), FrequentWords)

詞雲

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM