Python中的多类文本分类

Question

我试图解释为创造一个多元文本分类在这里。 但是，我的代码中断了：

NB_pipeline.fit(X_train, train[category])

以下是我得到的错误：

File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)

我试图找出返回的train[category] ，但遇到了同样的错误。

1） X_train是一个只有一列的dataframe X_train ，包含客户反馈。

2） train是具有两列的dataframe ； 第一列包含客户评论（与X_train相同），第二列包含5个类别之一（ Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others ）。

3） category是上述类别之一。

以下是样本火车dataframe ：

Index           Feedback                                    Category
  0           While making payment got system error.         System error
              Staff behaviour was good at hotel

  1           While making payment got system error.         Staff Behaviour
              Staff behaviour was good at hotel

Answer 1

这是最被忽视的问题之一。

发生此错误的原因是，正在查找的“列”脚本在数据框中不可用。 您拥有的所有5个类别应为输入数据框中的列，如果其中一个类别适用于反馈/注释，则行将占1/0。 理想情况下，您的输入数据框应如下所示。

Index           Feedback                                  System error    Staff Behaviour
  0           While making payment got system error.         1                  1
              Staff behaviour was good at hotel

  1           While making payment got system error.         1                  0

  2           Staff behaviour was good at hotel              0                  1

我使用相同的注释来显示输入数据框的外观。

Python中的多类文本分类

问题描述

1 个解决方案

解决方案1
2 已采纳 2018-10-08 11:43:26

Python中的多类文本分类

问题描述

1 个解决方案

解决方案1 2 已采纳 2018-10-08 11:43:26

解决方案1
2 已采纳 2018-10-08 11:43:26