我需要针对均值和方差未知的三种正态分布的混合运行 EM 算法。 我的数据点是一个包含 500 行的列。 我要把它当作'S'。 首先,我需要为混合物 model 的负对数似然写一个 function。这是我写的: 然后我需要针对三个不同的起点运行 EM 算法 10 次迭代。 我将一次取一个起点,分别运 ...
我需要针对均值和方差未知的三种正态分布的混合运行 EM 算法。 我的数据点是一个包含 500 行的列。 我要把它当作'S'。 首先,我需要为混合物 model 的负对数似然写一个 function。这是我写的: 然后我需要针对三个不同的起点运行 EM 算法 10 次迭代。 我将一次取一个起点,分别运 ...
我想编写 R 代码来构建 dirichlet 混合 model。我用于 beta 分布的对数似然如下: (,)=(−1)ln¯+(−1)ln(1−)¯+lnΓ(+)−lnΓ()−lnΓ() 我需要帮助来初始化参数(alpha、beta 和为代码中使用的 gamma 分布设置额外参数)。 这是我想要 ...
sklearn.mixture object GaussianMixture提供了将 GMM 拟合到所提供数据的框架,但是如何从 sklearn gmm object 添加/删除组件以进行进一步的热启动? ...
我正在尝试将 PGMPY package 用于 python 来学习 bayesian.network 的参数。 如果我正确理解期望最大化,它应该能够处理缺失值。 我目前正在试验一个 3 变量 BN,其中前 500 个数据点有缺失值。 没有潜在变量。 尽管 pgmpy 中的描述表明它应该处理缺失值, ...
我正在尝试应用期望最大化算法来估计丢失的计数数据,但 R 中的所有包(例如 missMethods)都假定多元高斯分布。 假设服从泊松分布,我将如何应用期望最大化算法来估计缺失的计数数据? 假设我们有这样的数据: 使用 missMethods ( missMethods::impute_EM(x, ...
我有一个观察列表,其中每个数据点都是一对时间表达式(例如night , Morning )和 12 小时制的一个小时(即 1, 2, ..., 12): Y = {<e_i, h_i>}_i={1,...,N} 。 我想估计给定时间表达式的 24 小时时钟中的小时分布(或等效地,将每个数 ...
我正在尝试使用期望最大化(EM) 对我的数据进行分类。 但是由于我对 Python 和算法的经验有限,当我编写算法的 E 步时,方法 multivariate_normal.pdf() 返回零,我不知道为什么会发生这种情况以及如何解决它。 我的参数设置: E步: Function 用于 E ...
我正在使用statsmodels的MLEModel class 构建自定义统计空间 model,并使用.fit()方法拟合未知参数。 我认为它正在使用期望最大化,但我不确定,我在文档中找不到任何提示。 而且.fit()方法的冗长的output显示了单个优化的步骤,这让我更加怀疑。 如果它不使用 E ...
我的任务是为我所在的 class 实现期望最大化算法。在笔记中,我的教授评估了代码中使用的迭代公式,我检查了它们并且它们写得正确。 该问题要求我们从给定的 model 创建合成数据。 这个 model 写在下面的gauss_mix() function 中。 不过,我的最终 output 不是它应该 ...
在 R 中使用 EMCluster 库时出现以下错误: 这是我写的代码: 我正在使用 Iris 数据集。 我的目标是运行一个 EM 聚类算法并通过绘图等来描述我的观察结果。 ...
我收集了 300 个文档。 我使用 doc2vec 作为 EM 聚类的输入文件。 向量大小 = 30 我使用 WEKA 进行聚类。 结果在 arff 文件中。 样本: 现在,从这些结果中,如何获得每个集群中的前 10 个术语? ...
我是 pyMC3 的新手,我想知道是否可以使用它来解决以下问题:我有一个贝叶斯网络(我的 BN 的图像:我的问题的贝叶斯网络)并且我不知道参数在 A、B、C、D 和 S 的分布中,我只知道分布的类型(有离散分布和连续分布)。 我有来自 A、B、C 和 D 的数据(因此 S 是一个隐藏变量,它是离散的 ...
我正在尝试将 Python 代码转换为 Java。 但是,我无法找到一种方法来创建样本来训练期望最大化,因为它应该是一个具有 2 个值(来自 HSV 颜色空间的 S 和 V)的单通道矩阵,如下所示: 第 0 行:S、V 第 1 行:S、V 第 2 行:S、V 第 3 行:S、V ...
我正在尝试使用 YellowBrick 的 KElbowVisualizer 和 SKLearn 的期望最大化算法 class:GaussianMixture 为我的数据可视化肘部 plot。 当我运行它时,我得到标题中的错误。 (我也尝试过 ClassificationReport,但也失败了) ...
我对此代码的总体目标是在每个DNA序列中找到基于对数 - 得分评分矩阵报告最大对数分数的基序(较小序列)。 我正在搜索的.txt文件如下所示: .... 等等。 我正在研究我的代码的最大化步骤,我正在努力计算我的DNA序列中的基序的对数分数。 我有创建log-odds评分矩阵的 ...
我正在尝试实现bernoulli混合,并且想知道如何正确向量化计算而不会循环。 我尝试过各种版本的Apply,但无法获得所需的输出(dim = c(5,4,2)。我的组件参数应该在列表中而不是在矩阵中吗? ...
我知道可以将多个序列拟合到hmmlearn中,但是在我看来,这些序列需要从相同的分布中得出。 是否可以用从hmmlearn中的不同分布得出的几个观测序列拟合GMHMM? 我的用例:我想用来自不同股票的K金融时间序列拟合GMHMM,并预测在指定时间产生K股价的市场制度。 因此,矩阵输 ...
我正在尝试实现一个简单的EM算法。 到目前为止,除方差迅速缩小至零(收敛于数据均值)这一小问题外,它似乎运行良好。 (如果我不更新方差,它将收敛到均值完全可以!) 据我所知,这是由于过于靠近中心的点“加权”了,因此使算法降低了方差并缩小为零。 当我将公式从 至 该算法的效果要 ...
根据一篇论文 ,它应该起作用。 但是作为scikit-learn软件包的学习者。 所有示例代码都按此处的椭圆或圆形聚类。 我真的很想知道如何按照不同的模式对以下图进行聚类... 0 -3是特定时间段内的平均功率(分为4),而4、5、6分别对应年份的标准偏差,工作日/周末的差异,冬季/夏 ...
因此,在机器学习方面,我是一个业余爱好者,我正在尝试对Baum Welch算法进行编程,该算法是针对隐马尔可夫模型的EM算法的衍生。 在我的程序中,我正在使用新模型中每个观察序列的概率测试收敛性,然后在新模型小于或等于旧模型时终止。 但是,当我运行该算法时,它似乎收敛了一些,并且给出的结果远 ...