繁体 English 中英

C＃搜索PDF

[英]C# Searching PDFs

原文 2017-11-18 20:13:44 8 1 c#/ pdf/ search

我正在使用iTextSharp从pdf中获取内容。 我想允许用户搜索PDF，就像在任何搜索引擎上一样。 搜索应返回最相关的结果。 我已经编写了一个在文档上执行TF-IDF算法以返回相关结果的库。 在此过程中，我觉得自己可能正在重新发明轮子。

该用户应该能够搜索超过50,000个PDF。 所以有很多。 我不想将PDF的全部内容存储在我的数据库中，因为我认为这会非常昂贵。 为了减轻这种情况，我已经编写了库，以便在计算TF-IDF时它将接受频率分布。 这样，当我将PDF添加到系统中时，而不是每次执行搜索时，都可以阅读它。

是否存在已经在执行此类操作的库？

1 个解决方案

Lucene.NET将满足您的需求。

还有一些商业广告，例如我们的“ SearchUnit”

在C＃winform中搜索pdf

[英]Searching pdfs in a C# winform

[英]Combine PDFs c#

使用 iframe 在 C# MVC 中动态显示 PDF

[英]dynamically displaying PDFs in C# MVC with iframe

有什么方法可以在 C# 中“清理”PDF？

[英]Is there any way to "sanitize" PDFs in C#?

C＃：下载PDF并将其附加到MailMessage已损坏

[英]C#: downloading and attaching PDFs to MailMessage are corrupt

使用AJAX和C＃动态创建PDF

[英]Creating PDFs on the fly using AJAX & C#

C＃GhostScript将多个PDF转换为PostScript

[英]C# GhostScript convert multiple PDFs to PostScript

如何使用 C# 渲染 pdf

[英]How to render pdfs using C#

C＃搜索数组列表

[英]c# searching arraylist

C＃-搜索字符串

[英]C# - Searching strings

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在C＃winform中搜索pdf 结合PDF c＃使用 iframe 在 C# MVC 中动态显示 PDF 有什么方法可以在 C# 中“清理”PDF？ C＃：下载PDF并将其附加到MailMessage已损坏使用AJAX和C＃动态创建PDF C＃GhostScript将多个PDF转换为PostScript 如何使用 C# 渲染 pdf C＃搜索数组列表 C＃-搜索字符串

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM