繁体   English   中英

搜索文本 a PDF - 双结果

[英]Search for Text a PDF - double results

我有一个关于 PDF 文件中的搜索文本的问题,附在此处: pdf 共享链接 google drive 如果我搜索文本示例“1500”,我看到 4 个出现,但第 2 页中只有 2 个出现......如果我搜索文本“musei”找到 2 个出现,但该文本仅在第 1 页中。

该研究解析单页并在每一页中查找所有文档文本,因为我有双重结果。

谁能解释为什么会这样? 这个 PDF 文件是否以特定方式生成,是否考虑到其他可以搜索文本的地方?

非常感谢

那PDF确实很特别,每一页都包含两页的文字。 在第一页上,来自第二页的文本位于右页边框的右侧,而在第二页上,来自第一页的文本位于左页边框的左侧。 此外,各个其他页面的内容还位于剪辑区域之外。

我将第一页的页面框(媒体框,裁剪框,...)放大到右侧和第二页的左侧,然后标记所有文本( Ctrl-A )以显示剪辑之外的文本区域,你会看到:

截屏

对于仅提取可见区域中的文本的文本提取,您应该将文本提取例程限制在相应页面的裁剪框内。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM