[英]Error in kmodes() for categorical datasets with missing values (or alternate algorithms) with r
[英]R, error in kmodes() application to a text matrix
我正在嘗試將R中的kmodes聚類方法(來自klaR包)應用於由大約1000個字符串和6列組成的文本矩陣。 不幸的是,我收到一個我無法理解的錯誤:
kmodes(mat, 5, iter.max=10)
Error in cluster[j] <- which.min(dist) : replacement has length zero
您對發生這種情況有任何想法嗎?
編輯:這是頭(墊):
1 aaa ccc iii <NA> 0
2 aaa ddd kkk <NA> 0
3 aaa eee -273 <NA> 0
4 aaa fff lll <NA> 0
5 bbb ggg 67 <NA> 0
6 bbb hhh mmm <NA> 0
您可以很好地使用kmodes(na.omit(mat), 5, iter.max = 10)
,但這將導致數據丟失,這是kmodes(na.omit(mat), 5, iter.max = 10)
。 您可以改為檢查summary(mat)
以查找丟失的數據或NA值,然后使用隨機插補替換它們。
dataframeName$variable <- with(dataframeName, impute(variable, 'random'))
如果列/變量中的NA值太多,則也可以忽略該列。 查看鏈接: -https : //discuss.analyticsvidhya.com/t/how-to-handle-missing-values-of-categorical-variables/310
我有同樣的錯誤。 似乎是由於缺少數據。 首先從數據中刪除丟失的數據,例如,使用kmodes(na.omit(mat), 5, iter.max=10)
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.