簡體   English   中英

如果兩個特定字符之間具有匹配編號,則使用正則表達式列表理解以匹配整個項目

[英]list comprehension with Regex to match whole item if it has matching number between two specific characters

這個問題是這篇文章的延續。 我有以下列表:

list_paths=[imgs/foldeer/img_ABC_21389_1.tif.tif,
imgs/foldeer/img_ABC_15431_10.tif.tif,
imgs/foldeer/img_GHC_561321_2.tif.tif,
imgs_foldeer/img_BCL_871125_21.tif.tif,
...]

我希望能夠運行一個 for 循環來匹配具有特定數字的字符串,這是第三次出現的“_”到“.tif.tif”之間的數字,例如,當數字為 1 時,字符串為匹配的是“imgs/foldeer/img_ABC_21389_1.tif.tif”,

對於數字 2,匹配字符串將為“imgs/foldeer/img_GHC_561321_2.tif.tif”。

為此,我想使用列表理解來使用正則表達式。 基於這個答案,我在 Regex101 上測試了這個正則表達式:


number = 10
pattern = rf"^\S*?/(?:[^\s_/]+_){{3}}{number}\.tif\b[^\s/]*$"

indices = [for x in data if re.search(pattern, x)]

但這不匹配任何東西,也不能確保它會采用准確的數字,所以如果數字是 1,它也可能是 select 項目與數字 10。

我的最終目標是能夠使用正則表達式匹配列表中請求編號介於第二次出現“_”和第一次出現“.tif”之間的項目,並尋求有關正則表達式的幫助。

output 應該是整個路徑,而不僅僅是數字。

您可以稍微簡化現有的正則表達式模式,以使用對結尾.tif.tif的精確匹配

import re
data=['imgs/foldeer/img_ABC_21389_1.tif.tif',
'imgs/foldeer/img_ABC_15431_10.tif.tif',
'imgs/foldeer/img_GHC_561321_2.tif.tif',
'imgs_foldeer/img_BCL_871125_21.tif.tif']

number = 2
pattern = rf"^\S*?/(?:[^\s_/]+_){{3}}{number}\.tif\.tif$"
print([x for x in data if re.search(pattern, x)])

Output:

['imgs/foldeer/img_ABC_15431_2.tif.tif']

我的最終目標是能夠使用正則表達式匹配列表中請求編號介於第二次出現“_”和第一次出現“.tif”之間的項目,並尋求有關正則表達式的幫助。

number = 1
pattern = rf"^\S*?/(?:[^\s_/]+_){{3}}{number}\.tif\.tif$"
print([x for x in data if re.search(pattern, x)])

Output:

['imgs/foldeer/img_ABC_21389_1.tif.tif']

如您所見,當數字為 1 時,只有 1 的模式匹配(即使我們有一個模式在數據中有 10),output 是 - ['imgs/foldeer/img_ABC_21389_1.tif.tif']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM