[英]Implementing LSA for elasticsearch index
最近幾天,我全神貫注於為在Elasticsearch中建立索引的文檔實施潛在語義分析。 第一步是構建term-document矩陣,所以我認為使用stanford nlp庫作為索引輸入,意思是小寫,刪除停用詞,可能是詞干並生成矩陣,或者有可能使用elasticsearch java api構建它?
是的,您可以使用_analyze
端點並在文本上進行tokenizing/character mapping/stemming/...
_analyze
tokenizing/character mapping/stemming/...
,然后返回結果。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.