[英]How to read a Lucene index?
我正在研究一个项目,我想通过读取Lucene索引并将其修剪下来来构建标记云。 我没有设置Lucene引擎,它是团队中的其他人,现在我只想读取它的索引。 你是如何用Java做的?
你这样做 -
IndexReader r = IndexReader.open( "prdb_index");
int num = r.numDocs();
for ( int i = 0; i < num; i++)
{
if ( ! r.isDeleted( i))
{
Document d = r.document( i);
System.out.println( "d=" +d);
}
}
r.close();
你需要寻找的是如何使用IndexReader类, .terms()方法将返回索引中的所有术语。
这样做:
File indexDirectory = new File("YourIndexLocation");
IndexReader reader = IndexReader.open(FSDirectory.open(indexDirectory));
return reader.maxDoc(); //return total docs in index
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.