[英]Multiclass Text Classification in Python
我试图解释为创造一个多元文本分类在这里 。 但是,我的代码中断了:
NB_pipeline.fit(X_train, train[category])
以下是我得到的错误:
File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)
我试图找出返回的train[category]
,但遇到了同样的错误。
1) X_train
是一个只有一列的dataframe
X_train
,包含客户反馈。
2) train
是具有两列的dataframe
; 第一列包含客户评论(与X_train
相同),第二列包含5个类别之一( Systems Error, Proactive Communication, Staff Behaviour, Website Functionalities, Others
)。
3) category
是上述类别之一。
以下是样本火车dataframe
:
Index Feedback Category
0 While making payment got system error. System error
Staff behaviour was good at hotel
1 While making payment got system error. Staff Behaviour
Staff behaviour was good at hotel
这是最被忽视的问题之一。
发生此错误的原因是,正在查找的“列”脚本在数据框中不可用。 您拥有的所有5个类别应为输入数据框中的列,如果其中一个类别适用于反馈/注释,则行将占1/0。 理想情况下,您的输入数据框应如下所示。
Index Feedback System error Staff Behaviour
0 While making payment got system error. 1 1
Staff behaviour was good at hotel
1 While making payment got system error. 1 0
2 Staff behaviour was good at hotel 0 1
我使用相同的注释来显示输入数据框的外观。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.