[英]python extract capitalized words using regex
我想提取大寫的單詞,該單詞在單詞“ cell”或“ cells”之前出現3或4
例如:
簡而言之,將如上所述生長的MCF-7細胞用一系列的LTX-二醇或異-LTX-二醇處理。
我想從上述示例中提取MCF-7。
我嘗試使用[A-Z0-9-]+cells
,但是它返回的單元格而不是MCF-7
該答案假定您要匹配一個以大寫字母開頭的單詞,該單詞依次由1至4個其他單詞組成,然后由cell
或cells
。 我們可以嘗試使用以下模式進行匹配:
([A-Z][^ ]*)(?=\s+(?:[^A-Z]\S*\s+){1,4}cells?)
在圖案的端部的正預測先行斷言為之前出現1至4個字的要求cell
或cells
。
input = "Briefly, MCF-7 idential cells grown as described above were treated with a range of LTX-diol or iso-LTX-diol."
r1 = re.findall(r"([A-Z][^ ]*)(?=\s+(?:[^A-Z]\S*\s+){1,4}cells?)", input)
print(r1)
['MCF-7']
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.