簡體   English   中英

使用php搜索word或pdf文件中的文本短語

[英]searching text phrases in word or pdf files with php

需要在msword / pdf文件的內容中搜索文本短語並返回匹配的文檔。 我有10000多個文檔。 讀取所有文檔以搜索文本短語並返回的速度更快? 是否將word / pdf文檔的內容存儲在MySQL表或文本文件中?

如何最好地將msword / pdf文檔內容存儲在MySQL數據庫中? 哪種數據類型最適合在MySQL表中使用?

我會將所有內容保存為Word或pdf,但不是使用PHP搜索文檔,而是制作了一個python腳本來搜索文檔,從PHP調用它並將匹配的文檔返回給PHP。 Python處理這類事情要快得多。

如果您在數據庫中有文檔內容,mysql搜索也會很快,但是您對內容長度有一些限制( 這里是有關限制的信息),並且您還必須閱讀所有文檔並將它們保存到數據庫中。 我認為您可以節省大量時間來制作python腳本來搜索它們。

編輯

以下是一些性能測試(2016年)。 如果您使用的是PHP 7,則實際上是最快的。 https://blog.famzah.net/2016/02/09/cpp-vs-python-vs-perl-vs-php-performance-benchmark-2016/

還要檢查文章=>“巨蟒被進一步認為是最好的編程語言,用於開發科學應用和需要處理大量數據的應用程序。”

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM