使用python正則表達式提取變量

Question

輸入文件包含以下幾行：

a=b*c;
d=a+2;
c=0;
b=a;

現在，對於每一行，我想提取已使用的變量。例如，對於第一行，輸出應為[a,b,c] 。當前我正在執行以下操作：

var=[a,b,c,d]     # list of variables
for line in file_ptr :
    if '=' in line :
        temp=line.split('=') :
        ans=list(temp[0])
        if '+' in temp[1] :
             # do something
        elif '*' in temp[1] :
             # do something
        else :
             # single variable as line 4  OR constant as line 3

是否可以使用正則表達式來做到這一點？

編輯：

上述文件的預期輸出：

[a,b,c]
[d,a]
[c]
[a,b]

Answer 1

我將使用re.findall()來匹配示例編程語言中變量名的任何模式。 假設使用一種典型的語言，這可能對您有用：

import re

lines = '''a=b*c;
d=a+2;
c=0;
b=a;'''

for line in lines.splitlines():
    print re.findall('[_a-z][_a-z0-9]*', line, re.I)

Answer 2

我會使用一些較短的模式來匹配變量名：

import re
strs = ['a=b*c;', 'd=a+2;', 'c=0;', 'b=a;']
print([re.findall(r'[_a-z]\w*', x, re.I) for x in strs])

參見Python演示

模式匹配：

[_a-z] _或ASCII字母（由於不區分大小寫的修飾符使用re.I因此任何大寫或小寫）
\\w* -0個或多個字母數字或下划線字符。

見正則表達式演示

Answer 3

如果只需要變量，請執行以下操作：

answer = []
for line in file_ptr :
    temp = []
    for char in line:
        if char.isalpha():
            temp.append(char)
    answer.append(temp)

不過請注意：這僅適用於長度恰好為1個字符的變量。 有關isalpha()更多詳細信息，請參見此處或此處。

Answer 4

我不確定您要做什么，但是您可以執行以下操作：

re.split(r'[^\w]', line)

給出該行中字母字符的列表：

>>> re.split(r'[^\w]', 'a=b*c;')
['a', 'b', 'c', '']

Answer 5

這是我做的：

l=re.split(r'[^A-Za-z]', 'a=b*2;')
l=filter(None,l)

使用python正則表達式提取變量

問題描述

5 個解決方案

解決方案1
1 已采納 2016-05-04 21:20:23

解決方案2
1 2016-05-04 21:24:32

解決方案3
0 2016-05-04 20:57:34

解決方案4
0 2016-05-04 20:58:11

解決方案5
0 2016-05-04 21:16:19

使用python正則表達式提取變量

問題描述

5 個解決方案

解決方案1 1 已采納 2016-05-04 21:20:23

解決方案2 1 2016-05-04 21:24:32

解決方案3 0 2016-05-04 20:57:34

解決方案4 0 2016-05-04 20:58:11

解決方案5 0 2016-05-04 21:16:19

解決方案1
1 已采納 2016-05-04 21:20:23

解決方案2
1 2016-05-04 21:24:32

解決方案3
0 2016-05-04 20:57:34

解決方案4
0 2016-05-04 20:58:11

解決方案5
0 2016-05-04 21:16:19