簡體   English   中英

如何使用lucene.net索引文件夾

[英]how to index a folder using lucene.net

我正在嘗試使用lucene.net在asp.net中開發一個搜索引擎。 我瀏覽了許多教程和頁面,以獲得適當的結果,但是我做不到。 實際上,我有一個包含一些文件(doc,ppt,pdf,excel等的文件夾),我只想在該文件夾中搜索內容,如果在該文件夾中未找到結果,則請用戶在網上搜索。

例如,我有一個包含數千個文件的文件夾@ C:\\ test,如果用戶搜索“ miller”,則它應該搜索每個文檔。 如果找到結果,則應顯示類似結果

搜索的文本文件沒有發生的情況miller C:\\ test \\ 1 \\ file.doc 5 miller C:\\ test \\ 1 \\ 11 \\ new.doc 2

請幫助我,我沒有得到適當的結果。

Lucene / Lucene.NET只是一個索引引擎,您仍然必須從要支持自己的文件類型中提取文本-在Windows上,如果安裝了Acrobat Reader 7+,則可以對許多文件類型使用IFilter界面應該內置了對IFilter for PDF文件的支持。 至於索引部分本身,那里有很多很多樣本。

另請參見此線程。 什么是使用C#或經典ASP(VBScript)從PDF提取文本的好方法?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM