繁体   English   中英

正则表达式,字符串中仅包含数字c ++

[英]regex with only numbers in a string c++

我正在寻找一个正则表达式来查找字符串中的数字; 如果我有一个像这样的字符串:

li 12.12 si 43,23 45 31 uf 889 uf31 3.12345

我只想查找数字:

12.12 45 31 889 3.12345

我尝试使用以下模式:

((\\\\+|-)?[[:digit:]]+)(\\\\.(([[:digit:]]+)?))?

但输出包括uf3143,23

我尝试过:

(?!([az]*((\\\\+|-)?[[:digit:]]+)(\\\\.(([[:digit:]]+)?))?[az]*))?((\\\\+|-)?[[:digit:]]+)(\\\\.(([[:digit:]]+)?))?

但这给出了相同的结果。

解决办法是什么?

解决方案:后代解决方案:

实际上,C ++正则表达式模块支持look-aheads

这是我的建议:

#include <iostream>
#include <regex>
using namespace std;

int main() {
    std::string buffer = " li 12.12 si 43,23 45 31 uf 889 uf31 3.12345";
    std::regex rx(R"((?:^|\s)([+-]?[[:digit:]]+(?:\.[[:digit:]]+)?)(?=$|\s))"); // Declare the regex with a raw string literal
    std::smatch m;
    std::string str = buffer;
    while (regex_search(str, m, rx)) {
        std::cout << "Number found: " << m[1] << std::endl; // Get Captured Group 1 text
        str = m.suffix().str(); // Proceed to the next match
    }  
    return 0;
}

IDEONE演示

由于使用原始字符串文字声明,因此无需在\\s使用双反斜杠。

先行(?=$|\\s)检查是否存在,但不占用空格,可以提取连续的数字。

请注意,如果您需要提取.5等十进制值,则需要

R"((?:^|\s)([+-]?[[:digit:]]*\.?[[:digit:]]+)(?=$|\s))"

正如stribizhev所说,这只能通过外观来实现。 由于在搜索空格之前和之后的号码时,否则需要使用单个空格分隔数字。

user2079303为正则表达式提供了一个可行的选择 ,可以将其简化到与正则表达式的简单性相当的程度:

for_each(istream_iterator<string>(istringstream(" li 12.12 si 43,23 45 31 uf 889 uf31 3.12345")),
         istream_iterator<string>(),
         [](const string& i) {
            char* it;
            double num = strtod(i.c_str(), &it);
            if (distance(i.c_str(), const_cast<const char*>(it)) == i.size()) cout << num << endl; });

但是,只需使用strtok ,就可以在没有istringstream或regex istringstream情况下完成此操作:

char buffer[] = " li 12.12 si 43,23 45 31 uf 889 uf31 3.12345";

for (auto i = strtok(buffer, " \f\n\r\t\v"); i != nullptr; i = strtok(nullptr, " \f\n\r\t\v")) {
    char* it;
    double num = strtod(i, &it);

    if (*it == '\0') cout << num << endl;
}

请注意,对于我的定界符参数,我只是使用默认的isspace值。

正则表达式通常不可读,很难证明其正确性。 仅匹配有效有理数的正则表达式必须复杂且容易弄乱。 因此,我提出了一种替代方法。 代替正则表达式,使用c ++标记您的字符串,并使用std::strtod来测试输入是否为有效数字。 这是示例代码:

std::vector<std::string> split(const std::string& str) {
    std::istringstream iss(str);
    return {
        std::istream_iterator<std::string>{iss},
        std::istream_iterator<std::string>{}
    };
}

bool isValidNumber(const std::string& str) {
    char* end;
    std::strtod(str.data(), &end);
    return *end == '\0';
}

// ...
auto tokens = split(" li 12.12 si 43,23 45 31 uf 889 uf31 3.12345");
std::vector<std::string> matches;
std::copy_if(tokens.begin(), tokens.end(), std::back_inserter(matches), isValidNumber);

您需要此正则表达式:

(?<!,)\b([\d\.]+)\b(?!,)

使用否定的前瞻性和后向性断言数字的两边没有有趣的字符:

(?<![^\\s])(\\+|-)?[0-9]+(\\.[0-9]*)?(?![^\\s])

不幸的是,由于内置函数不支持这些构造,因此您将需要Boost.Regex来完成该任务。

您最好将输入拆分为单词 ,然后对每个单词使用一个简单的正则表达式。

两次尝试:

#include <string>
#include <iostream>
#include <regex>
#include <sstream>


int main()
{
    using namespace std;

    string buffer(" li 12.12 si 43,23 45 31 uf 889 uf31 3.12345 .5");

    regex num_regex("(^|\\s)([\\+-]?([0-9]+\\.?[0-9]*|\\.?[0-9]+))(\\s|$)");
    smatch num_match;
    while (regex_search(buffer, num_match, num_regex))
    {
        if (num_match.size() >= 4) //3 groups = 4 matches
        {
            //We only need the second group
            auto token = num_match[2].str();
            cout << token << endl;
        }

        buffer = num_match.suffix().str();
    }
    return 0;
}

#include <string>
#include <iostream>
#include <regex>
#include <sstream>


int main()
{
    using namespace std;

    string buffer(" li 12.12 si 43,23 45 31 uf 889 uf31 3.12345 .5");

    istringstream iss(buffer);
    vector<string> tokens{ istream_iterator<string>{iss}, istream_iterator<string>{} };

    regex num_regex("^[\\+-]?([0-9]+\\.?[0-9]*|\\.?[0-9]+)$");
    for(auto token : tokens)
    {
        if (regex_search(token, num_regex))
        {
            //Valid entry
            cout << token << endl;
        }
    }

    return 0;
}

您可以玩弄花样来消费不需要的东西。 这样的事情。

(?:\d+,|[a-z]+)\d+|(\d+[.\d]*)

修改管道中应排除的所有内容,包括预捕获和第一组捕获。

请参阅regex101上的演示 不知道是否(:对于c ++,非捕获组是可以的。如果没有,请删除。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM