cost 399 ms
寻找组成员的最重要变量 - Most important variables for finding group membership

我有一个数据集,包含 118 个变量的 8100 个观察值,用于确定每个受访者属于 4 个组中的哪一个。 我感兴趣的是哪些变量对于预测组成员资格最重要。 我的数据是序数和二进制的组合。 我最初做了一个判别式 function 分析,但后来读到这不能很好地处理二进制数据。 接下来我尝试了多项逻辑回归。 ...

运行线性判别分析 (lda) 时,R 中的 function 中的列名出现问题 - Problem with column names in a function in R when running linear discriminant analysis (lda)

这是我的示例数据集,其中D列是第一个因素。 当我运行lda时,它运行良好: 但是,当我尝试将其复制到 function 中时,我被卡住了。 我尝试了几种选择: 带引号 -> fun1(df, "D") 没有引号 -> fun1(df, D) 在这两种情况下,我都会收到如下所示的错误: 我 ...

kmeans() 的替代方法,用于发现 k=2 的小簇 - Alternatives to kmeans() for spotting small clusters for k=2

我有两列D1和D2 。 这些分布如图。 我想拆分obs。 在 2 个集群中。 该理论预测,两者中的一个将比另一个小得多。 对我来说,给定两个维度之间的线性关系 (R^2 =.9),合理的拆分是有点D1 > 75或有点D1 >.55 。 但是,当我对数据运行kmean(2)时,建议的集群 ...

R 中的 function 中的 Output 带有列表(lda model,ggplot,dataframe) - Output of a function in R with a list (lda model, ggplot, dataframe)

我正在努力研究如何在我正在使用元素列表创建的 R 中获取 function 的 output。 显然这很简单,但是,我无法深入了解。 我在 SO 中检查了不同的问题,但没有结果。 这可能是一个简单的问题,可能我打印错误了一些行。 我正在创建的 function 的 output 具有三个我认为应该 ...

如何在 R 中使用 LDA(线性判别分析)model 进行预测 - How to make predictions using an LDA (Linear discriminant analysis) model in R

正如标题所示,我正在尝试使用 R 中的 LDA model 进行预测。 我有两组正在使用的数据:第一组是与 16 个预测变量和 1 个结果变量相关联的一系列条目(结果变量是每个条目属于我自己分配的“组”) ,第二组数据也包含与相同的 16 个预测变量相关联的条目,但没有结果变量。 我想做的是预测第二 ...

使用线性判别分析的分类问题错误 - Classification problem error using linear discriminant analysis

您好我正在尝试为一个项目实施线性判别分析模块,但我被困在这里的是 git repo: 线性判别分析: 线性判别分析 编码 : 事实是:我想实现 cov 矩阵 bat 我用 np.cov 得到的结果不是我所期望的: 我得到了什么 我所期望的: 请帮我解决这个问题 ...

在 R 中将递增累积循环的结果打印为单个数据帧 - Printing the results of an increasing cumulative loop as a single data frame in R

我一直在对 R 中的主成分分析结果进行最小判别分析,并且我一直在根据代表返回的累积变化的某个阈值的 PC 的最小数量计算要使用的适当 PC 数量遵循之前一些研究中的方法,重新分类率最高。 我一直在使用循环计算各种累积 PC 数量的重新分类率,但希望将其打印为 RMarkdown 报告的 data.f ...

如何在拟合我的估计器之前使用 sklearn RFECV 到 select 传递到降维步骤的最佳特征 - How to use sklearn RFECV to select the optimal features to pass to a dimensionality reduction step before fitting my estimator

在使用 KNN 拟合我的估计器之前,如何使用 sklearn RFECV 方法来 select 将最佳特征传递给 LinearDiscriminantAnalysis(n_components=2) 方法进行降维。 我从此代码中收到以下错误。 如果我在没有 LinearDiscriminantAna ...

查找数据在 LDA 中分配给的三个类的均值 - Finding the means of the three classes the data have been assigned to in LDA

我正在查看有关如何计算基于 Q = W^{-1}B 的 Fisher LDA 的示例代码。 数据导入如下: 我有以下 Fisher 的 LDA 示例。 使用solve(W, B)计算 Q,然后找到 Q 的第一个特征向量,然后分配类别: 命令str(classified)产生以下 output: 我想 ...

LDA 协方差矩阵与计算的协方差矩阵不匹配 - LDA covariance matrix not match calculated covariance matrix

我希望更好地理解 scikit-learn 的 LDA 对象返回的 covariance_ 属性。 我确定我遗漏了一些东西,但我希望它是与输入数据相关的协方差矩阵。 但是,当我将 .covariance_ 与 numpy.cov() 返回的协方差矩阵进行比较时,我得到了不同的结果。 任何人都可以 ...

如何使用统计方法计算某些受访者组的加权平均值(未给出加权因子时)? - How to calculate the weighted mean (when weighting factor is not given) for some groups of respondents using a statistical method?

我们有 4 个队列(15、10、5、20 人),其中每个队列(10、6、5、16)中的少数人都给出了回应,以测量一周内的体重(增加或减少)(以公斤为单位)服用药物时。 我们必须为每个队列计算一个加权因子来衡量加权平均值,以便我们可以比较药物对这些队列的相对影响。 ...

缩放 LDA 决策边界 - Scale LDA decision boundary

我有一个非常规的问题,很难找到解决方案。 非常感谢您的帮助。 我有 4 个基因(特征),我的分类是二进制(0 和 1)。 经过多次反复,我最终确定使用 LDA 进行分类。 我有不同的研究,每个研究比较相同的两个类别,我在每项研究中使用这 4 个基因训练了我的 model。 我想以点 plot 的形式 ...

根据多维数据在python中的类之间绘制边界线? - Plot boundary lines between classes in python based on multidimensional data?

我试图根据此文档在sklearn Python中使用LDA绘制虹膜数据集的边界线。 对于二维数据 ,我们可以使用LDA.coef_和LDA.intercept_轻松绘制线。 但是对于已缩减为两个分量的多维数据 , LDA.coef_和LDA.intercept具有许多维度,我不知道如 ...

与R中的fitcdiscr等效(关于Coeffs.linear和Coeffs.Const) - Equivalent to fitcdiscr in R (regarding Coeffs.linear and Coeffs.Const)

我目前正在将一些MATLAB脚本翻译为R,以进行多变量数据分析。 目前,我正在尝试生成与MATLAB中fitdiscr函数的Coeffs.Linear和Coeffs.Const部分相同的数据。 使用的代码是: 数据分为3组。 不幸的是,R函数似乎仅对两个LD执行LDA,而MAT ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM