繁体   English   中英

如何阅读Lucene索引?

[英]How to read a Lucene index?

我正在研究一个项目,我想通过读取Lucene索引并将其修剪下来来构建标记云。 我没有设置Lucene引擎,它是团队中的其他人,现在我只想读取它的索引。 你是如何用Java做的?

通过“阅读”索引不确定你的意思:

  1. 如果要查询它,可以使用IndexSearcher类。

  2. IndexReader允许您以读取模式打开索引。

如果要查看索引的内容,可以使用Luke

你这样做 -

IndexReader r = IndexReader.open( "prdb_index");

int num = r.numDocs();
for ( int i = 0; i < num; i++)
{
    if ( ! r.isDeleted( i))
    {
        Document d = r.document( i);
        System.out.println( "d=" +d);
    }
}
r.close();

你需要寻找的是如何使用IndexReader类, .terms()方法将返回索引中的所有术语。

这样做:

File indexDirectory = new File("YourIndexLocation");
IndexReader reader = IndexReader.open(FSDirectory.open(indexDirectory));
return reader.maxDoc(); //return total docs in index

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM