繁体 English 中英

为什么sklearn LatentDirichletAllocation的fit和partial_fit会返回不同的结果？

[英]Why does the fit and the partial_fit of the sklearn LatentDirichletAllocation return different results ?

原文 2016-02-12 14:30:23 3 1 python/ scikit-learn

奇怪的是，它似乎与fit和partial_fit完全相同。

您可以在以下链接中查看代码：

https://github.com/scikit-learn/scikit-learn/blob/c957249/sklearn/decomposition/online_lda.py#L478

1 个解决方案

代码不完全相同; partial_fit使用total_samples ：

“total_samples：int，optional（default = 1e6）文档总数。仅用于partial_fit方法。”

https://github.com/scikit-learn/scikit-learn/blob/c957249/sklearn/decomposition/online_lda.py#L184

（ 部分适合 ） https://github.com/scikit-learn/scikit-learn/blob/c957249/sklearn/decomposition/online_lda.py#L472

（适合） https://github.com/scikit-learn/scikit-learn/blob/c957249/sklearn/decomposition/online_lda.py#L510

以防万一您感兴趣：只要您的数据集非常大， partial_fit就是一个很好的候选者。 因此，不要遇到可能的内存问题 ，而是以较小的批量执行拟合，这称为增量学习 。

因此，在您的情况下，您应该考虑total_samples默认值为1000000.0 。 因此，如果您不更改此数字并且您的实际样本数量更大，那么您将从fit方法和fit_partial获得不同的结果。 或者可能是您在fit_partial中使用迷你批次并且未覆盖您为fit方法提供的所有样本的fit 。 即使你做得对，你也可以得到不同的结果，如文档中所述：

“增量学习者本身可能无法应对新的/看不见的目标类。在这种情况下，你必须使用classes =参数将所有可能的类传递给第一个partial_fit调用。”
“[...]选择一个合适的算法是，所有这些算法都不会随着时间的推移对每个例子赋予相同的重要性[...]

sklearn文档： https ：//scikit-learn.org/0.15/modules/scaling_strategies.html#incremental-learning

sklearn partial_fit（）未显示准确的结果为fit（）

[英]sklearn partial_fit() not showing accurate results as fit()

partial_fit Sklearn的MLPClassifier

[英]partial_fit Sklearn's MLPClassifier

在sklearn中使用partial_fit的GridSearchCV/RandomizedSearchCV

[英]GridSearchCV/RandomizedSearchCV with partial_fit in sklearn

带有 partial_fit() 的 MLPRegressor

[英]MLPRegressor with partial_fit()

如何使用sklearn的IncrementalPCA partial_fit

[英]How to use sklearn's IncrementalPCA partial_fit

为什么“ partial_fit”方法比“ fit”方法花费更长的时间

[英]Why does the “partial_fit” method take much longer than the “fit” method

SkLearn SGDRegressor 中partial_fit 中的批次大小和时期数

[英]Batch size and number of epochs in partial_fit in SkLearn SGDRegressor

sklearn多层感知器中的partial_fit函数

[英]partial_fit function in sklearn Multi Layer Perceptron

分类器fit和partial_fit发生内存错误

[英]Memory Error with Classifier fit and partial_fit

为什么“SGDClassifier”中的“partial_fit”会逐渐降低模型精度

[英]Why does `partial_fit` in `SGDClassifier` suffer from gradual reduction in model accuracy

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 sklearn partial_fit（）未显示准确的结果为fit（） partial_fit Sklearn的MLPClassifier 在sklearn中使用partial_fit的GridSearchCV/RandomizedSearchCV 带有 partial_fit() 的 MLPRegressor 如何使用sklearn的IncrementalPCA partial_fit 为什么“ partial_fit”方法比“ fit”方法花费更长的时间 SkLearn SGDRegressor 中partial_fit 中的批次大小和时期数 sklearn多层感知器中的partial_fit函数分类器fit和partial_fit发生内存错误为什么“SGDClassifier”中的“partial_fit”会逐渐降低模型精度

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM