当某些书籍具有多种类型时，如何按类型对书籍进行分类（使用深度学习）？

Question

我正在尝试建立一个神经网络，以查看一本书的文字并猜测该书的类型。 当每本书只有一种类型时，我可以进行网络训练。 当书籍与多种流派相关联时，有没有很好的方法来训练网络？

我尝试使用sklearn的基本SGDClassifier。 它可以很好地与数据集配合使用，该数据集将每本书/每块文本都与一种类型相关联。 不幸的是，我不知道如何给它提供一个数据集，其中每本书/每块文本都与多种流派相关联。

这是我用于上下文的基本代码：

from sklearn.linear_model import SGDClassifier

sgd = Pipeline([('vect', CountVectorizer()),

                ('tfidf', TfidfTransformer()),

                ('clf', SGDClassifier('basic parameters')),

               ])

sgd.fit(x_train, y_train)

y_pred = sgd.predict(x_test)

有谁知道解决这个问题的好方法？ 谁能将我链接到一个聪明人已经解决了的地方？

Answer 1

应该在stats.stackexchange.com上问这个问题，但是我将尽力回答。 您在这里拥有的是多标签“分类问题”。 假设您拥有3种类型的A，B和C，您可以考虑将这3种类型的每种组合视为一个类别，那么您将获得以下类别[0 0 0]，[1 0 0]，[0 1 0]，[ 0 0 1]，[1 1 0]，[1 0 1]，[0 1 1]。 [1 1 1]和[1 0 1]例如是一本是A和C的书。

这些链接应该可以帮助您理解和处理问题

https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff https://towardsdatascience.com/multi-label-classification-and-class-activation-map-on-fashion -mnist-1454f09f5925

当某些书籍具有多种类型时，如何按类型对书籍进行分类（使用深度学习）？

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-08-15 08:08:30

当某些书籍具有多种类型时，如何按类型对书籍进行分类（使用深度学习）？

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-08-15 08:08:30

解决方案1
1 已采纳 2019-08-15 08:08:30