标签[scikit-learn]

scikit-learn是一个用于Python的机器学习库,它提供了简单有效的数据分析和数据挖掘工具,重点是机器学习。 每个人都可以使用它,并且可以在各种情况下重复使用。 它基于NumPy和SciPy。 该项目是开源的,可商业使用(BSD许可证)。

0
0回复
12

无法从数据帧切片运行预测,卡住了应该是2d的1d数组

我有一个训练有素的模型,它训练的数据框每天都会更新,其中包含所有功能的新样本。 我已经尝试将包含该样本的切片保存到要预测的变量中,但出现错误: 代码: 这是实际的切片: 使用 x.reshape(1, -1) 进行整形会返回相同的一维数组的相同错误。 如何确保二维数组到达模型?
0
0回复
07

计算混淆矩阵时,输入变量的样本数不一致时出现错误

我再次收到此错误:ValueError:在计算混淆矩阵时发现样本数量不一致的输入变量:[16979, 271664]。 在我之前的帖子中,我在创建 CNN 模型时询问,并解决了我的问题,使用相同的代码为具有相同数据集的预训练模型计算混淆矩阵,并再次出现此错误。 我不知道我为什么要拥有它,如果有人可以
-1
0回复
17

使用python逻辑执行sklearnfit方法的步骤是什么?

X 是 X和y对应一个dataframe的某些列的值,我想要实现的是手动创建fit方法,即使用X作为训练数据,y作为目标值来拟合模型(不允许使用sklearn .fit() 指令直接)。
0
1回复
22

来自sklearn的支持向量回归给出了平坦的预测

我正在对这个数据集进行支持向量回归,我认为我启动的 SVR 可能与我调用变量或使用内核的方式有关。 MWE 的代码很长,所以我对它进行了大量评论并突出显示了相关部分 当我绘制transformed_area的预测值与实际值时,我得到了这些图,即所有X数据的预测值都是恒定的。 我正在使用实例化模型/
-1
0回复
36

如何生成分类器的集合?

我想为 GaussianNB、线性 SVC、MLPClassifier 和 DecisionTreeClassifier 构建一个包含 100 个分类器的集合,存储为一个列表。 然后我想测量每个分类器的单个弱学习器的性能。 首先,我定义了分类器的 10 倍评估。 然后,我构建了一个弱学习器来分析每个
0
0回复
14

x数据缩放下的KernelRidge参数

我正在使用来自 sklearn 的 KernelRidge: 对于 alpha=1 和 gamma=1e4 的问题,我获得了满意的结果。 我想用标准缩放器重新缩放 x 数据。 为简单起见,假设 x 数据已经居中,则 x_scaled = x * b。 应该如何修改参数 alpha 和 gamma 以
0
0回复
37

Python与Matlab中的FastICA性能

我正在尝试从 Python 中的 Matlab 移植以下 ICA 实现。 根据我的理解,它使用带有双曲余弦作为对比函数的紧缩正交化。 通过 sklearn使用FastICA 可以获得令人满意的结果,但是与 Matlab 相比,执行时间极慢。 作为比较,以下示例数据的执行时间如下: Python
0
0回复
27

k-Means聚类顺序

我遵循了 Python 的 k-Means 教程: https://jakevdp.github.io/PythonDataScienceHandbook/05.11-k-means.html 但我的问题更普遍的是关于 sklearn 和 openCV 中包含的 Python 的 k-Means
1
0回复
08

Pipeline的最后一步应该实现fit或者是字符串'passthrough'

我正在尝试构建简单的管道: 我收到错误: 怎么了 ? 我该如何解决?
0
1回复
08

如何转换自定义向量化器以预测分类?

就我google了,我没有找到类似的问题,或者我用不好的关键字搜索了它。 我想做一个特征提取的变体。 矢量化为简单的词袋 向量化词袋,结合附加功能因此,对于第一种方法,我使用此代码拟合转换数据集(这是我的功能的一部分。df 是数据帧,vect 是 TFIDF/countvectorizer) 因此
0
0回复
06

导出sklearn和/或xgboost模型对象以在excel或vba中使用?

我目前已经使用 sklearn 和 xgboost(使用相同的数据)训练和测试了几个监督模型。 xgboost 模型的性能略好于 sklearn 的 LassoCV。 我正在尝试找到一种导出模型对象的方法,以便非技术人员可以在 Excel 和/或 VBA 中与它进行交互。 具体来说,非技术人员需要
0
0回复
07

无法安装scikit-survival

我无法在 ec2 中安装 scikit-survival。 有人可以指导我。 下面是requirements.txt astor==0.8.1 autograd==1.3 autograd-gamma==0.5.0 boto3==1.18.10 botocore==1.21.10 cycler==0
1
1回复
15

skleanSVM/SVC总是为任何给定的输入预测相同的类

我正在尝试使用语音数据训练 SVM,此处使用 RAVDESS 数据集,您可以在此处找到: https ://www.kaggle.com/uwrfkaggler/ravdess-emotional-speech-audio 这个数据集有 24 个目录,但我只使用了前 20 个目录。 首先,我正在导航
0
0回复
07

在pyenv中找到正确版本的python/sklearn以使用机器学习模型

我在 Kaggle 上腌制了一个模型并尝试下载它以在本地运行。 使用诗歌和 pyenv 我运行以下命令来创建一个项目: 但收到以下错误。 如果我只是使用 sklearn 并用诗歌安装它,我在 VS Code 中执行我的代码时会收到此错误。 这是我试图运行的代码。 我正在尝试根据我在 Kaggle
0
0回复
21

SKLearnLinearRegression预测结果是否取决于列顺序?

似乎SKLearn LinearRegression预测结果取决于X_train (和X_test )的列顺序,尽管在我的理解 OLS 线性回归解决方案应该独立于它: 结果是: 系数也不同(值也不同,而不仅仅是按顺序)。 我在这里做错了什么?
-1
1回复
23

“ValueError:y应该是一个一维数组,而是得到了一个形状为(3,4)的数组。”使用sklearn中的fit()时

我输入: 然后我的控制台输出: 我该如何解决? 我是初学者。 请说清楚。
0
0回复
16

手写线性回归不会过拟合,即使它应该

我正在手写一个带有梯度下降算法的线性回归,但是我的模型显示出惊人的好结果,即使它应该过拟合。 我找不到它不过度拟合的原因,来自 sklearn 的标准线性回归正是这样做的,而且,稍后,在我正在做的练习中,由于这个过度拟合问题,您应该使用 L2 正则化。 我的函数计算梯度(MSE): 我的梯度下降函数
3
0回复
33

为什么np.hypot和np.subtract.outer非常快?

我有两组大的 2D 点,我需要计算一个距离矩阵。 我需要它在 python 中运行得很快,所以很明显我使用了 numpy。 我最近了解了 numpy 广播并使用了它,而不是在 python 中循环,numpy 将在 C 中进行。 我真的认为广播就是我所需要的,直到我看到其他方法比普通广播更好,我有两
-1
1回复
25

我尝试在Jupyter笔记本中将Pandas作为pd导入并得到“AttributeError:module'numpy'hasnoattribute'ndarray'”

----> 1 import pandas as pd 中的AttributeError Traceback(最近一次调用) ~\\anaconda3\\lib\\site-packages\\pandas_ init _.py in 20 21 # numpy compat --->
-1
1回复
18

使用sklearn在MNIST数据集上进行手写数字识别

我想使用 sklearn 在 MNIST 数据集上构建手写数字识别,并且我想为特征(x)和标签(y)洗牌我的训练集。 但它显示了一个 KeyError。 让我知道什么是正确的方法。

1 2 3 4 5 6 7 8 9 10 下一页