繁体   English   中英

试图弄清潜在语义索引(LSI)

[英]Trying to make sense of Latent Semantic Indexing(LSI)

我正在学习奇异值分解,并且出于什么目的可以使用此概念,而我正在阅读的书中提到在潜在语义索引中使用了SVD。 我读了几篇有关LSI的文章,看来LSI主要用于搜索引擎和类似的应用程序。 我想将LSI用于我正在从事的小型数据分析项目,但不确定是否对我的应用程序有意义。 这是我正在使用的。

我有大约2万个游戏的列表,此列表中的2个属性是游戏类型和发布游戏的平台。 我想使用LSI获得有关平台和类型属性的一些信息。

因此,首先,我创建了一个共现矩阵,其中行代表24种不同类型,列代表22种不同平台。 然后我对共现矩阵进行了SVD分解,提取了U和V的前两列,并为U和V绘制了二维图,该图看起来像这样。

在此处输入图片说明

所以我的问题是,这是否可以被认为是潜在语义索引的一种有意义的用法,又该如何从这张图中解释呢? 例如,我们看到Genre Action和平台PC与所有其他变量相距甚远,这是否特别告诉我们有关该类型和平台的任何信息?

谢谢。

SVD通常用于减少尺寸并发现隐藏的宏特征或图案,以实现更细粒度的行为。 这种方法几乎可以解决所有推荐系统问题。

我不确定您用来实现SVD的参数(如果它已经收敛),但是对图形可能有一些解释:

  • 显然是2种类型的游戏平台(恰好是真正的控制台与PC)
  • 有诸如“ SPORT”之类的游戏主要在控制台上玩,而诸如“射击者,RPG,模拟,冒险”之类的其他游戏则与平台无关(在这两者上都可以找到)。
  • 我对“策略”和“动作”游戏不太确定

祝好运

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM