简体   繁体   English

Java Lucene从Document对象获取条款

[英]Java Lucene Obtain Terms from Document object

我了解如何从Term对象获取文档集,但是您可以通过另一种方法从Document对象获取术语/术语频率吗?

Yes, it is possible get terms from a document, but there are no easy APIs. 是的,可以从文档中获取术语,但是没有简单的API。 IndexReader has aa method getTermFreqVector where you can retrieve terms in a document. IndexReader有一个getTermFreqVector方法,您可以在其中检索文档中的术语。 You need to build a custom TermVectorMapper and pass it getTermFreqVector(). 您需要构建一个自定义TermVectorMapper并将其传递给getTermFreqVector(). In the custom TVMapper, terms and their frequencies are collected in map() method. 在自定义TVMapper中,术语及其频率通过map()方法收集。 Once the getTermFreqVector() returns, terms can be retrieved from the custom TVMapper. 一旦getTermFreqVector()返回,就可以从自定义TVMapper中检索术语。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM