[英]Trying to make sense of Latent Semantic Indexing(LSI)
我正在学习奇异值分解,并且出于什么目的可以使用此概念,而我正在阅读的书中提到在潜在语义索引中使用了SVD。 我读了几篇有关LSI的文章,看来LSI主要用于搜索引擎和类似的应用程序。 我想将LSI用于我正在从事的小型数据分析项目,但不确定是否对我的应用程序有意义。 这是我正在使用的。
我有大约2万个游戏的列表,此列表中的2个属性是游戏类型和发布游戏的平台。 我想使用LSI获得有关平台和类型属性的一些信息。
因此,首先,我创建了一个共现矩阵,其中行代表24种不同类型,列代表22种不同平台。 然后我对共现矩阵进行了SVD分解,提取了U和V的前两列,并为U和V绘制了二维图,该图看起来像这样。
所以我的问题是,这是否可以被认为是潜在语义索引的一种有意义的用法,又该如何从这张图中解释呢? 例如,我们看到Genre Action和平台PC与所有其他变量相距甚远,这是否特别告诉我们有关该类型和平台的任何信息?
谢谢。
SVD通常用于减少尺寸并发现隐藏的宏特征或图案,以实现更细粒度的行为。 这种方法几乎可以解决所有推荐系统问题。
我不确定您用来实现SVD的参数(如果它已经收敛),但是对图形可能有一些解释:
祝好运
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.