Python：將list.index與正則表達式一起使用

Question

我有一些要提取某個值的字符串列表：

["bla","blabla","blablabla","time taken to build model: 5.1 seconds", "blabla"]

通常我會尋找我要尋找的元素的索引

list.index("time taken")

但是隨着時間的變化，我考慮使用正則表達式。 我只是不知道如何做到這一點。

那么，如何找出與某個正則表達式匹配的列表元素的索引，例如re.match（）？ （如果不遍歷列表，這將花費很長時間）

Answer 1

不確定是否有內置方法，但是通過O(n)時間的列表推導很容易做到。

使用正則表達式：

import re
your_list = ["bla","blabla","blablabla","time taken to build model: 5.1 seconds", "blabla"]
regex = re.compile("^time taken")
idxs = [i for i, item in enumerate(your_list) if re.search(regex, item)]

並且沒有正則表達式：

your_list = ["bla","blabla","blablabla","time taken to build model: 5.1 seconds", "blabla"]
query_term = 'time taken'
idxs = [i for i, item in enumerate(your_list) if item.startswith(query_term)]

您可以使它返回第一個找到的索引或最后一個找到的索引，這取決於該方法或在一種方法中對其進行了參數化以提供靈活性。

Answer 2

要在列表中查找元素，除非您有其他信息（例如元素順序），否則必須對其進行遍歷。 如果您確實想更快地運行，請更改結構，使用數據庫或使用其他語言。

Answer 3

正則表達式解決方案需要按順序進行迭代。 如果要獲取帶有某些前綴或后綴的字符串，則應實現Trie，這是解決問題的最快方法。 同樣，您也可以使用不同長度的循環哈希來實現解決方案，但是在某些情況下，它是無效的。

Answer 4

如果您的首要任務是獲得序列中的第一個匹配項，那么只有index()才有用。 如果您想在index()方法中使用regex，就可以這樣做

lst=["bla","blabla","blablabla","time taken to build model: 5.1 seconds", "blabla"]

lst.index([i for i in lst if re.findall(r'^time taken', i)][0])

Python：將list.index與正則表達式一起使用

問題描述

4 個解決方案

解決方案1
1 2016-05-11 04:01:20

解決方案2
0 2013-10-25 13:43:33

解決方案3
0 2013-10-25 13:51:04

解決方案4
0 2019-04-03 14:10:07

Python：將list.index與正則表達式一起使用

問題描述

4 個解決方案

解決方案1 1 2016-05-11 04:01:20

解決方案2 0 2013-10-25 13:43:33

解決方案3 0 2013-10-25 13:51:04

解決方案4 0 2019-04-03 14:10:07

解決方案1
1 2016-05-11 04:01:20

解決方案2
0 2013-10-25 13:43:33

解決方案3
0 2013-10-25 13:51:04

解決方案4
0 2019-04-03 14:10:07