繁体   English   中英

如何在R中使用随机森林对文本数据运行LIME

How can I run LIME on text data using random forest in R

提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供   中文繁体   英文版本   中英对照 版本,有任何建议请联系yoyou2525@163.com。

我正在尝试使用R在具有随机森林模型的文本数据上运行LIME。但是,在运行'lime :: explain'函数时,我不断收到错误消息“ as.data.frame.default(newdata,stringsAsFactors中的错误= TRUE):无法将类'structure(“ dgCMatrix”,package =“ Matrix”)'强制转换为data.frame“。 我已经尽力解决了所有问题,但我自己无法解决。 有谁可以帮助我吗?

供参考,我使用的示例是“ https://www.shirin-glander.de/2018/07/explaining_ml_models_code_text_lime/”

rf <- train(x = as.matrix(dtm_train2),
y = factor(clothing_reviews_train$Liked),
method = "ranger",
num.trees = 10,
importance = "impurity"
)

explainer <- lime(clothing_reviews_train$text, 
 congress_rf,
preprocess = create_dtm_mat)

说明<-石灰::说明(clothing_reviews_test $ text [1:4],解释器,n_labels = 1,n_features = 5)

问题暂未有回复.您可以查看右边的相关问题.
1 使用R对文本数据进行预测

我的数据框中有两列:文本和类别 示例文本:实际文本数据要大得多。两列用|分隔。 我想分析文本列并预测类别。 在实际数据中,有100个这样的类别。 这样做的最佳方法是什么? 我正在用R语言这样做。 ...

2 在R中使用随机森林进行文本分类

嗨,我是R新手,想在R中执行短信分类。数据包含2列:“类型”:垃圾邮件或火腿,“消息”:字符。 我已经执行了数据清理并将数据转换为文档期限矩阵 data_dtm &lt;- DocumentTermMatrix(corpus, control = list(global = c(2, I ...

3 在r中使用分类数据作为特征向量运行和绘制随机森林

我有如下数据。 它具有三列。 第一个是分类数据,第二列是数字,最后一个是我的班级标签。 我想在我的数据上运行一个随机森林并绘制树以及变量的重要性。 我的目的是找到哪个subject_result最重要,然后跟随什么并查看树。 使用此代码有错误 同样使用rpart和ctree ...

4 如何使用文本数据调整随机森林分类器的超参数

我想使用CV方法来调整随机森林分类器的超参数。 在这一点上,我很乐意简单地调整理想的树木数量(n_estimators)。 我的输入变量是一个文本字符串(独立var)和一个标签(dep var)。 我感到困惑的是,TfidfVectorizer在哪里发挥作用? 我到处搜索示例代码 ...

6 R中使用随机森林预测的不同结果

当我在我的测试数据上运行随机森林模型时,我得到的是相同数据集+模型的不同结果。 以下是您可以看到第一列的差异的结果: 虽然差异非常小,但我正在努力了解导致这种情况的原因。 我猜测predict具有“灵活”的分类阈值,尽管我在文档中找不到; 我对吗? 先感谢您 ...

7 R / Python - 对文本数据进行聚类

我有一组数字。 我的数字有不同的格式,如12-12-123-123 , 123-123-123-12 , 123-:12-(123 , ABC-123-12-123整个数据集有大约150格式考虑他们作为。字符串,有没有办法我可以将所有数字分组为特定格式,以便给定一个新数字,它应检查新数字是否匹 ...

9 关于使用R的随机森林的不同结果

我拟合了随机森林模型,其中使用插入符号包进行交叉验证,发现每个分割处的变量数mtry被发现。 我的代码如下, 我使用所有数据获得了最终模型,并且mtry = 2,如下所示, 但是当我使用randomforest软件包对整个数据使用mtry = 2的相同模型时,我得到了不同的结果 ...

10 如何在R中使用igraph绘制Twitter文本数据图

在使用R中的igraph程序包创建5个Twitter帐户使用的常用单词的图表时,我正在寻找一些帮助填补我的经验中的空白的帮助。 我的目的是查看帐户共享哪些关键字,并识别1个帐户共有的其他关键字,而不是其他帐户。 我已经从推文中创建了一个wordcloud,但是我很感谢社区在将其转换为图形 ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM