繁体   English   中英

如何使用lucene.net搜索文件内容?

[英]How do I use lucene.net for searching file content?

我目前正在使用lucene.net来搜索文件内容以进行关键字搜索。 我能够正确获得结果,但是有一种情况需要显示在特定文件中找到的关键字。

有两个不同的文件,分别包含“ karthik ”和“ steven ”,如果我搜索“ karthik and steven ”,则能够同时显示两个文件。 如果我仅分别搜索“ karthik ”和“ steven ”,则仅显示相应的文件。

当我同时搜索“ karthik and steven ”时,由于我仅显示文件名,因此在结果中同时得到两个文件,现在我需要在该特定文件中显示的特定关键字作为列表视图中的记录显示。

   Public bool StartSearch()
    {
        bool bResult = false;
        Searcher objSearcher = new IndexSearcher(mstrIndexLocation);
        Analyzer objAnalyzer = new StandardAnalyzer();

        try
        {
            //Perform Search
            DateTime dteStart = DateTime.Now;
            Query objQuery = QueryParser.Parse(mstrSearchFor, "contents", objAnalyzer);
            Hits objHits = objSearcher.Search(objQuery, objFilter);
            DateTime dteEnd = DateTime.Now;
            mlngTotalTime = (Date.GetTime(dteEnd) - Date.GetTime(dteStart));
            mlngNumHitsFound = objHits.Length();
            //GeneratePreviewText(objQuery, mstrSearchFor,objHits);
            //Generate results - convert to XML
            mstrResultsXML = "";
            if (mlngNumHitsFound > 0)
            {
                mstrResultsXML = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?><Results>";
                //Loop through results
                for (int i = 0; i < objHits.Length(); i++)
                {
                    try
                    {
                        //Get the next result
                        Document objDocument = objHits.Doc(i);
                        //Extract the data
                        string strPath = objDocument.Get("path");
                        string strFileName = objDocument.Get("name");
                        if (strPath == null) { strPath = ""; }
                        string strLastWrite = objDocument.Get("last_write_time");
                        if (strLastWrite == null)
                            strLastWrite = "unavailable";
                        else
                        {
                            strLastWrite = DateField.StringToDate(strLastWrite).ToShortDateString();
                        }
                        double dblScore = objHits.Score(i) * 100;
                        string strScore = String.Format("{0:00.00}", dblScore);
                        //Add results as an XML row
                        mstrResultsXML += "<Row>";
                        //mstrResultsXML += "<Sequence>" + (i + 1).ToString() + "</Sequence>";
                        mstrResultsXML += "<Path>" + strPath + "</Path>";
                        mstrResultsXML += "<FileName>" + strFileName + "</FileName>";
                        //mstrResultsXML += "<Score>" + strScore + "%" + "</Score>";
                        mstrResultsXML += "</Row>";
                    }
                    catch
                    {
                        break;
                    }
                }
                //Finish off XML
                mstrResultsXML += "</Results>";
                //Build Dataview (to bind to datagrid
                DataSet objDS = new DataSet();
                StringReader objSR = new StringReader(mstrResultsXML);
                objDS.ReadXml(objSR);
                objSR = null;
                mobjResultsDataView = new DataView();
                mobjResultsDataView = objDS.Tables[0].DefaultView;
            }
            //Finish up
            objSearcher.Close();
            bResult = true;
        }
        catch (Exception e)
        {
            mstrError = "Exception: " + e.Message;
        }
        finally
        {
            objSearcher = null;
            objAnalyzer = null;
        }
        return bResult;
    }

上面是我用于搜索的代码和我绑定到listview的xml,现在我需要标记在相应文档中找到的特定关键字,并将其作为记录显示在listview中,类似于下面的listview

找不到文件名关键字

1个Test.Doc karthik

2 Test2.Doc史蒂文

我希望你们能理解这个问题,

这取决于您的文档如何编制索引。 您需要提取原始内容,将其通过分析器以获取索引的标记,然后检查与生成的查询匹配的内容。

只需使用contrib的Highlighter.Net软件包即可,它可以完成更多任务。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM