我有一个数据集,包含 118 个变量的 8100 个观察值,用于确定每个受访者属于 4 个组中的哪一个。 我感兴趣的是哪些变量对于预测组成员资格最重要。 我的数据是序数和二进制的组合。 我最初做了一个判别式 function 分析,但后来读到这不能很好地处理二进制数据。 接下来我尝试了多项逻辑回归。 ...
我有一个数据集,包含 118 个变量的 8100 个观察值,用于确定每个受访者属于 4 个组中的哪一个。 我感兴趣的是哪些变量对于预测组成员资格最重要。 我的数据是序数和二进制的组合。 我最初做了一个判别式 function 分析,但后来读到这不能很好地处理二进制数据。 接下来我尝试了多项逻辑回归。 ...
这是我的示例数据集,其中D列是第一个因素。 当我运行lda时,它运行良好: 但是,当我尝试将其复制到 function 中时,我被卡住了。 我尝试了几种选择: 带引号 -> fun1(df, "D") 没有引号 -> fun1(df, D) 在这两种情况下,我都会收到如下所示的错误: 我 ...
我有两列D1和D2 。 这些分布如图。 我想拆分obs。 在 2 个集群中。 该理论预测,两者中的一个将比另一个小得多。 对我来说,给定两个维度之间的线性关系 (R^2 =.9),合理的拆分是有点D1 > 75或有点D1 >.55 。 但是,当我对数据运行kmean(2)时,建议的集群 ...
我正在努力研究如何在我正在使用元素列表创建的 R 中获取 function 的 output。 显然这很简单,但是,我无法深入了解。 我在 SO 中检查了不同的问题,但没有结果。 这可能是一个简单的问题,可能我打印错误了一些行。 我正在创建的 function 的 output 具有三个我认为应该 ...
正如标题所示,我正在尝试使用 R 中的 LDA model 进行预测。 我有两组正在使用的数据:第一组是与 16 个预测变量和 1 个结果变量相关联的一系列条目(结果变量是每个条目属于我自己分配的“组”) ,第二组数据也包含与相同的 16 个预测变量相关联的条目,但没有结果变量。 我想做的是预测第二 ...
您好我正在尝试为一个项目实施线性判别分析模块,但我被困在这里的是 git repo: 线性判别分析: 线性判别分析 编码 : 事实是:我想实现 cov 矩阵 bat 我用 np.cov 得到的结果不是我所期望的: 我得到了什么 我所期望的: 请帮我解决这个问题 ...
我尝试使用 LDA 并找到一个 3 通道的 output。但它的 output 只有 2 个通道。 我使用 [i, i, j, j] 因为 LDA 要求我有更多特征的 x。 并打印 output 是: ((392960, 2), (392960,), (392960, 4))但对于 out.sha ...
我在数据集上运行 LDA,所有指标的结果都很好。 但是,我似乎无法像 PCA 那样提取顶级功能或负载。 有没有人熟悉在使用 sklearn python3 时从 LDA 中提取顶级特征/负载? ...
我测量了数百只蜥蜴的几个字符(例如尾巴长度)。 我根据各种方法将这些蜥蜴分为 5 种,作为可诊断性的额外衡量标准,我想运行判别 Function 分析 (DFA)。 我正在关注本教程( https://www.r-bloggers.com/2021/05/linear-discriminant-an ...
您好,我正在运行此代码,但我的 fit 函数出现错误 这是错误: 有人有解决它的想法吗? (在升级 scikit learn 以及在 google collab 上遇到同样的错误) 谢谢 ! ...
在 Python 中,我可以通过对具有 2 个类的数据执行线性判别分析来获得 200k 中的 100 个最佳特征吗? ...
我一直在对 R 中的主成分分析结果进行最小判别分析,并且我一直在根据代表返回的累积变化的某个阈值的 PC 的最小数量计算要使用的适当 PC 数量遵循之前一些研究中的方法,重新分类率最高。 我一直在使用循环计算各种累积 PC 数量的重新分类率,但希望将其打印为 RMarkdown 报告的 data.f ...
在使用 KNN 拟合我的估计器之前,如何使用 sklearn RFECV 方法来 select 将最佳特征传递给 LinearDiscriminantAnalysis(n_components=2) 方法进行降维。 我从此代码中收到以下错误。 如果我在没有 LinearDiscriminantAna ...
我正在查看有关如何计算基于 Q = W^{-1}B 的 Fisher LDA 的示例代码。 数据导入如下: 我有以下 Fisher 的 LDA 示例。 使用solve(W, B)计算 Q,然后找到 Q 的第一个特征向量,然后分配类别: 命令str(classified)产生以下 output: 我想 ...
我正在使用 Matlab 命令fitcdiscr来实现具有 379 个功能和 8 个类的 LDA。 我想获得每个特征的全局权重,以研究它们对预测的影响。 如何从 ClassificationDiscriminant 对象的 Coeffs 字段中的成对(对于每对类)系数获得它? ...
我希望更好地理解 scikit-learn 的 LDA 对象返回的 covariance_ 属性。 我确定我遗漏了一些东西,但我希望它是与输入数据相关的协方差矩阵。 但是,当我将 .covariance_ 与 numpy.cov() 返回的协方差矩阵进行比较时,我得到了不同的结果。 任何人都可以 ...
我们有 4 个队列(15、10、5、20 人),其中每个队列(10、6、5、16)中的少数人都给出了回应,以测量一周内的体重(增加或减少)(以公斤为单位)服用药物时。 我们必须为每个队列计算一个加权因子来衡量加权平均值,以便我们可以比较药物对这些队列的相对影响。 ...
我有一个非常规的问题,很难找到解决方案。 非常感谢您的帮助。 我有 4 个基因(特征),我的分类是二进制(0 和 1)。 经过多次反复,我最终确定使用 LDA 进行分类。 我有不同的研究,每个研究比较相同的两个类别,我在每项研究中使用这 4 个基因训练了我的 model。 我想以点 plot 的形式 ...
我试图根据此文档在sklearn Python中使用LDA绘制虹膜数据集的边界线。 对于二维数据 ,我们可以使用LDA.coef_和LDA.intercept_轻松绘制线。 但是对于已缩减为两个分量的多维数据 , LDA.coef_和LDA.intercept具有许多维度,我不知道如 ...
我目前正在将一些MATLAB脚本翻译为R,以进行多变量数据分析。 目前,我正在尝试生成与MATLAB中fitdiscr函数的Coeffs.Linear和Coeffs.Const部分相同的数据。 使用的代码是: 数据分为3组。 不幸的是,R函数似乎仅对两个LD执行LDA,而MAT ...