簡體   English   中英

從php中的pdf提取文本不適用於所有PDF文件

[英]extract text from pdf in php is not working for all PDF files

我正在從PDF文件提取文本。 這是代碼:

<?php

require("PdfToText.php");

$file   =  'SamplePF' ;
$pdf    =  new PdfToText ( "$file.pdf" ) ;
echo ( $pdf -> Text ) ;

?>

此類對於某些PDF文件效果很好。 此類的問題是:

  1. 對於某些PDF文件,它從隨機頁面/行中獲取文本,而不是按頁面順序排列。
  2. 對於某些PDF文件,它沒有顯示任何結果。
  3. 對於某些PDF文件,它僅提取一兩行。

請提出一些解決方案。 謝謝!

我不確定這可能是確切的問題,因為您不能提取該問題,但是從pdf提取數據時我也遇到了類似的問題。 有時,PDF文件被所有者密碼鎖定,這對文檔設置了一定的限制,並且不允許更改,內容復制或提取等以保護其版權問題。 檢查此鏈接以獲取有關所有者密碼的更多信息

因此,您可以先嘗試刪除所有者密碼,然后再嘗試提取此類pdf文件。 要刪除所有者密碼,可以在線使用多種工具,您可以選擇最合適的一種。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM