繁体   English   中英

当某些书籍具有多种类型时,如何按类型对书籍进行分类(使用深度学习)?

[英]How do you classify books by genre (using deep learning) when some books have multiple genres?

我正在尝试建立一个神经网络,以查看一本书的文字并猜测该书的类型。 当每本书只有一种类型时,我可以进行网络训练。 当书籍与多种流派相关联时,有没有很好的方法来训练网络?

我尝试使用sklearn的基本SGDClassifier。 它可以很好地与数据集配合使用,该数据集将每本书/每块文本都与一种类型相关联。 不幸的是,我不知道如何给它提供一个数据集,其中每本书/每块文本都与多种流派相关联。

这是我用于上下文的基本代码:

from sklearn.linear_model import SGDClassifier

sgd = Pipeline([('vect', CountVectorizer()),

                ('tfidf', TfidfTransformer()),

                ('clf', SGDClassifier('basic parameters')),

               ])

sgd.fit(x_train, y_train)

y_pred = sgd.predict(x_test)

有谁知道解决这个问题的好方法? 谁能将我链接到一个聪明人已经解决了的地方?

应该在stats.stackexchange.com上问这个问题,但是我将尽力回答。 您在这里拥有的是多标签“分类问题”。 假设您拥有3种类型的A,B和C,您可以考虑将这3种类型的每种组合视为一个类别,那么您将获得以下类别[0 0 0],[1 0 0],[0 1 0],[ 0 0 1],[1 1 0],[1 0 1],[0 1 1]。 [1 1 1]和[1 0 1]例如是一本是A和C的书。

这些链接应该可以帮助您理解和处理问题

https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff https://towardsdatascience.com/multi-label-classification-and-class-activation-map-on-fashion -mnist-1454f09f5925

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM