簡體   English   中英

R,kmodes()應用到文本矩陣中的錯誤

[英]R, error in kmodes() application to a text matrix

我正在嘗試將R中的kmodes聚類方法(來自klaR包)應用於由大約1000個字符串和6列組成的文本矩陣。 不幸的是,我收到一個我無法理解的錯誤:

kmodes(mat, 5, iter.max=10)
Error in cluster[j] <- which.min(dist) : replacement has length zero

您對發生這種情況有任何想法嗎?

編輯:這是頭(墊):

1       aaa      ccc         iii         <NA>             0
2       aaa      ddd         kkk         <NA>             0
3       aaa      eee        -273         <NA>             0
4       aaa      fff         lll         <NA>             0
5       bbb      ggg          67         <NA>             0
6       bbb      hhh         mmm         <NA>             0

您可以很好地使用kmodes(na.omit(mat), 5, iter.max = 10) ,但這將導致數據丟失,這是kmodes(na.omit(mat), 5, iter.max = 10) 您可以改為檢查summary(mat)以查找丟失的數據或NA值,然后使用隨機插補替換它們。

dataframeName$variable <- with(dataframeName, impute(variable, 'random'))

如果列/變量中的NA值太多,則也可以忽略該列。 查看鏈接: -https : //discuss.analyticsvidhya.com/t/how-to-handle-missing-values-of-categorical-variables/310

我有同樣的錯誤。 似乎是由於缺少數據。 首先從數據中刪除丟失的數據,例如,使用kmodes(na.omit(mat), 5, iter.max=10)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM