如果一個單詞在Python中以非字母數字字符開頭，我如何匹配？

Question

假設我有一個文本文件，其中每行包含“1”或“-1”。 如何搜索文件以檢查文件是否包含至少一個“1”？

最初，我有以下內容。

if re.search(r'\b1', f.read()): return true
else: return false

但是，這不起作用，因為' - '不被視為字母數字字符串，如果文件不包含單個'1'則返回true。 確定文件是否包含“1”的最佳方法是什么？

Answer 1

使用re.MULTILINE標志， ^將匹配行的開始（而不僅僅是主題的開始）：

re.search(re.compile('^1', re.MULTILINE), f.read())

如果任何行以1開頭，則匹配。

請參閱http://docs.python.org/library/re.html#regular-expression-syntax

此替代解決方案避免完全讀取文件：

has_1 = any(line == "1" for line in f)

Answer 2

any('1' in line for line in file)是一種不將整個文件讀入內存的方法。

一種錯綜復雜但可能有效的方式

fmap = mmap.mmap(open('file').fileno(), 0)
'1' in fmap

您還可以對mmap的文件運行re。

re.search('^1', fmap, re.M)

Answer 3


f = open("textfile.txt", "rb")
lines = f.readlines()
new_lines = [line.replace("-1", "") for line in lines]
for line in new_lines:
    if "1" in line:
        print "Damn right!"
        break

Answer 4

def thingy(contents):
    return any(line.strip() == "1" for line in contents.splitlines())

thingy("1\n-1\n-1") # True
thingy("-1\n-1\n-1") # False

或者：

def thingy(contents):
    for line in contents.splitlines():
        if line.strip() == "1":
            return True

    return False

Answer 5

只需列表理解：

>>> if not None in [ re.search( r"1", line ) for line in f.readlines() ] :
        pass # <your code here>

Answer 6

如果“1”或“-1”始終出現在行的開頭，那么您可以將正則表達式更改為：

^1

如果它們總是出現在行的中間/末尾，那么使用：

[^-]1

如果它們有時在開始時出現，有時在中間/結束時出現，那么您可以嘗試以下方法：

^1|[^-]1

我沒有測試過這些。 最后一個，特別是，我不確定優先權是否正確。

如果一個單詞在Python中以非字母數字字符開頭，我如何匹配？

問題描述

6 個解決方案

解決方案1
1 已采納 2012-07-10 15:22:45

解決方案2
1 2012-07-10 15:37:50

解決方案3
1 2012-07-10 15:48:21

解決方案4
0 2012-07-10 15:25:51

解決方案5
0 2012-07-10 22:39:30

解決方案6
0 2012-07-12 11:37:09

如果一個單詞在Python中以非字母數字字符開頭，我如何匹配？

問題描述

6 個解決方案

解決方案1 1 已采納 2012-07-10 15:22:45

解決方案2 1 2012-07-10 15:37:50

解決方案3 1 2012-07-10 15:48:21

解決方案4 0 2012-07-10 15:25:51

解決方案5 0 2012-07-10 22:39:30

解決方案6 0 2012-07-12 11:37:09

解決方案1
1 已采納 2012-07-10 15:22:45

解決方案2
1 2012-07-10 15:37:50

解決方案3
1 2012-07-10 15:48:21

解決方案4
0 2012-07-10 15:25:51

解決方案5
0 2012-07-10 22:39:30

解決方案6
0 2012-07-12 11:37:09