简体   繁体   English

tweetopic.dmm.DMM class 的“n_components”参数是什么?

[英]What is the 'n_components' parameter for tweetopic.dmm.DMM class?

I am working on a project topic modeling tweets using the tweetopic Python library.我正在使用 tweetopic Python 库对项目主题建模推文。 I want to understand what the parameter "n_components" for the tweetopic.dmm.DMM class is.我想了解 tweetopic.dmm.DMM class 的参数“n_components”是什么。 I see in the documentation it's described as the "Number of mixture components in the model."我在文档中看到它被描述为“model 中混合物成分的数量”。 I'm new to topic modeling, so am not quite sure what that means.我是主题建模的新手,所以不太确定这意味着什么。

Thank you!谢谢!

Here is my code:这是我的代码:

tweetopic.dmm.DMM(n_components=10, n_iterations=100, alpha: float = 0.1, beta: float = 0.1) tweetopic.dmm.DMM(n_components=10, n_iterations=100, alpha: float = 0.1, beta: float = 0.1)

Tweetopic is like any other sklearn-compatible topic model. In all of sklearn's topic models you specify the number of topics with n_components . Tweetopic 与任何其他 sklearn 兼容的主题 model 一样。在所有 sklearn 的主题模型中,您使用n_components指定主题的数量。

I might change the documentation so that this gets clearer.我可能会更改文档,以便更清楚地说明这一点。 It says mixture components, because DMM is a mixture-model, meaning that it assumes that all texts come from a mixture of distributions, and each distribution (component) can be thought of as a topic.它说混合成分,因为DMM是一个混合模型,意味着它假设所有文本都来自分布的混合,并且每个分布(成分)都可以被认为是一个主题。 I hope I could be of help:)我希望我能有所帮助:)

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 LDA忽略n_components? - LDA ignoring n_components? 确定 PCA 的 n_components 使得解释的方差比为 0.99 - Determine n_components of PCA such that the explained variance ratio is 0.99 sklearn.pca()和n_components,线性代数难题 - sklearn.pca() and n_components, linear algebra dilemma 确定pca分析中n_components变量的值 - Determine the value of n_components variable in pca analysis 类型错误:PCA() 得到了一个意外的关键字参数“n_components” - TypeError: PCA() got an unexpected keyword argument 'n_components' TypeError:__init __()获得了意外的关键字参数'n_components' - TypeError: __init__() got an unexpected keyword argument 'n_components' 使用python读取DMM DNY2伺服驱动器存储的参数 - Read DMM DNY2 servo driver stored parameters using python n_components 不能大于 min(n_features, n_classes - 1)。 在执行 LDA 时 - n_components cannot be larger than min(n_features, n_classes - 1). while performing LDA 如何在Scikit-learn中使用`Dirichlet Process Gaussian Mixture Model`? (n_components?) - How to use `Dirichlet Process Gaussian Mixture Model` in Scikit-learn? (n_components?) 带有 n_components = 'mle' 和 svd_solver = 'full' 的 sklearn PCA 导致数学域错误 - sklearn PCA with n_components = 'mle' and svd_solver = 'full' results in math domain error
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM