正则表达式解析C ++枚举

Question

如何构造正则表达式来解析C ++枚举？ 我试过的枚举看起来像

enum Temperature
{
    C = 0,
    F=1,     // some elements are commented
    R,       // most elements are not gived a value
    K        // sometimes the last element is succeeded by a comma
} temperature;

// different indent style is used
enum Depth {
    m = 0,
    ft = 1,
} depth;

我尝试了几个简单的模式，但没有一个足以捕捉上述所有情况。

任何可以帮助我的regexp向导？

编辑：澄清，我想要名称和价值，例如C和0。

Answer 1

这很有挑战性:)下面是我能想到的最好的。 假设只给出{和}之间的文本，它会捕获所有名称和相应的值：

/(\w+)\s*(?:=\s*(\d+)|)\s*,?\s*(?:(?:\n|$)|\/\/.*?(?:\n|$)|)/

Answer 2

如果我们使用正则表达式匹配枚举而不是用它来解析枚举。 我认为这是可能的。 尝试这些步骤：

第1步。 确保C / C ++源代码可以编译成功。
第2步。 从C / C ++源代码中删除所有注释。
第3步。 匹配枚举

一个可行的Ruby示例代码：

# copy from Mastering Regular Expression 3rd
COMMENT = '/\*[^\*]*\*+(?:[^/*][^*]*\*+)*/'
COMMENT2 = '//[^\n]+'
DOUBLE = '"(?:\\.|[^\\"])*"'
SINGLE = '\'(?:\\.|[^\\\'])*\''
# pattern for match enum
ENUM = '\benum\s*(\w+)\s*\{(\s*\w+(?:\s*=\s*\w+)?(?:\s*,\s*\w+(?:\s*=\s*\w+)?)*)\s*(?:,\s*)?\}\s*\w+\s*;'

foo = File.open("foo.cpp", "r").read()
# strip all comments from foo.cpp
foo.gsub!(/(#{DOUBLE}|#{SINGLE})|#{COMMENT}|#{COMMENT2}/, '\1')
bar = []
# match enum...
foo.scan(/#{ENUM}/) do | m |
    printf("%s: %s\n", m[0], m[1].gsub(/\s/, ''))

end

输出：

Temperature: C=0,F=1,R,K
Depth: m=0,ft=1

正则表达式解析C ++枚举

问题描述

2 个解决方案

解决方案1
1 2011-08-23 12:20:05

解决方案2
0 2012-08-06 18:09:28

正则表达式解析C ++枚举

问题描述

2 个解决方案

解决方案1 1 2011-08-23 12:20:05

解决方案2 0 2012-08-06 18:09:28

解决方案1
1 2011-08-23 12:20:05

解决方案2
0 2012-08-06 18:09:28