![](/img/trans.png)
[英]Creating a pivot table and finding correlations between books with multiple genres
[英]How do you classify books by genre (using deep learning) when some books have multiple genres?
我正在尝试建立一个神经网络,以查看一本书的文字并猜测该书的类型。 当每本书只有一种类型时,我可以进行网络训练。 当书籍与多种流派相关联时,有没有很好的方法来训练网络?
我尝试使用sklearn的基本SGDClassifier。 它可以很好地与数据集配合使用,该数据集将每本书/每块文本都与一种类型相关联。 不幸的是,我不知道如何给它提供一个数据集,其中每本书/每块文本都与多种流派相关联。
这是我用于上下文的基本代码:
from sklearn.linear_model import SGDClassifier
sgd = Pipeline([('vect', CountVectorizer()),
('tfidf', TfidfTransformer()),
('clf', SGDClassifier('basic parameters')),
])
sgd.fit(x_train, y_train)
y_pred = sgd.predict(x_test)
有谁知道解决这个问题的好方法? 谁能将我链接到一个聪明人已经解决了的地方?
应该在stats.stackexchange.com上问这个问题,但是我将尽力回答。 您在这里拥有的是多标签“分类问题”。 假设您拥有3种类型的A,B和C,您可以考虑将这3种类型的每种组合视为一个类别,那么您将获得以下类别[0 0 0],[1 0 0],[0 1 0],[ 0 0 1],[1 1 0],[1 0 1],[0 1 1]。 [1 1 1]和[1 0 1]例如是一本是A和C的书。
这些链接应该可以帮助您理解和处理问题
https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff https://towardsdatascience.com/multi-label-classification-and-class-activation-map-on-fashion -mnist-1454f09f5925
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.