[英]SVD output interpretation in mahout
我正在尝试在mahout中运行SVD作业。 我有一个尺寸为372053 x 21338的矩阵(例如A)(文档x术语)(其中21338个不重复的单词说N,372053个文档说M)。 因此我的矩阵A的大小为(M * N)。 我使用mahout运行了svd,并得到了经过清理的特征向量(我给出的期望等级为200 say R)。 现在,我创建了一个特征向量矩阵,大小为R * N。
陈述SVD方程
A = U * S * V'(V'是V的转置)
我需要将矩阵A转换为新的空间,以获得文档的压缩向量(我正在尝试实现LSI)
mahout SVD的输出是什么? (我想根据上面的方程式知道)我阅读了邮件列表 ,我们可以从生成的特征向量矩阵中的NamedVectors获得特征值。
请指导我如何从这里开始在新空间(大小为M * R)中生成文档项矩阵A。
任何帮助都非常感激:)
对于LSI与随机SVD上Mahout的一个很好的起点,可以发现在这里 。 好的方面是,本文还描述了折叠过程,并根据svd方程明确显示了输出格式。
该作品已集成到最新版本0.8中,可以与SSVDCli
作业一起使用,也可以与mahout ssvd <options>
一起通过mahout CLI使用
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.