簡體   English   中英

python使用正則表達式提取大寫單詞

[英]python extract capitalized words using regex

我想提取大寫的單詞,該單詞在單詞“ cell”或“ cells”之前出現3或4

例如:

簡而言之,將如上所述生長的MCF-7細胞用一系列的LTX-二醇或異-LTX-二醇處理。

我想從上述示例中提取MCF-7。

我嘗試使用[A-Z0-9-]+cells ,但是它返回的單元格而不是MCF-7

該答案假定您要匹配一個以大寫字母開頭的單詞,該單詞依次由1至4個其他單詞組成,然后由cellcells 我們可以嘗試使用以下模式進行匹配:

([A-Z][^ ]*)(?=\s+(?:[^A-Z]\S*\s+){1,4}cells?)

在圖案的端部的正預測先行斷言為之前出現1至4個字的要求cellcells

input = "Briefly, MCF-7 idential cells grown as described above were treated with a range of LTX-diol or iso-LTX-diol."

r1 = re.findall(r"([A-Z][^ ]*)(?=\s+(?:[^A-Z]\S*\s+){1,4}cells?)", input)
print(r1)

['MCF-7']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM