使用 python 在 pdf 中搜索由逗號分隔的給定字符串

Question

例如，如果我有這樣的輸入 ['thermostat', 'lamp', 'motor'] 我必須搜索如下

文件列表中的恆溫器和燈
文件列表中的恆溫器和燈和電機

同樣，我必須做 n 長度。 請幫助我實現這些比較組合。

如果我知道字符串的確切長度，我已經搜索了單個輸入和多個輸入，如下所示：

file_path=myfilepath
file_type = "pdf"
search_string = input("Enter Search String:").split(",")
seen = []
j = 1
for filename in os.listdir(file_path):
if(filename.endswith(file_type)):
    text = parser.from_file(file_path + '\\' +filename)
    identified_text = text['content']
    # print(len(search_string))
    # print(lambda x : all(search_string[x] for s in search_string))
    if len(search_string) == 1:
        if re.search(search_string[0], identified_text, re.IGNORECASE):
            if filename not in seen:
                print(filename)
    if len(search_string) > 1:
            if re.search(search_string[0], identified_text, re.IGNORECASE) and re.search(search_string[1], identified_text, re.IGNORECASE):
                if filename not in seen:
                    print(filename)

我必須評估提取的文件中的字符串輸入以及是否應該動態生成條件

Answer 1

按照本教程閱讀pdf並獲取列表中的數據： https://pythontips.com/2016/02/25/ocr-on-pdf-files-using-python/

然后使用 list.split(',') 拆分列表

使用 python 在 pdf 中搜索由逗號分隔的給定字符串

問題描述

1 個解決方案

解決方案1
0 2019-10-21 11:46:52

使用 python 在 pdf 中搜索由逗號分隔的給定字符串

問題描述

1 個解決方案

解決方案1 0 2019-10-21 11:46:52

解決方案1
0 2019-10-21 11:46:52