繁体   English   中英

从字符串值中提取数字

[英]Extract number from string value

我有一个总是采用这种格式的字符串:

"TM" + 多个前导 0 + 数字 + 非数字字符 + 字母数字。

例如:TM000013452S20548、PB000013452S3DVSF。

在这种情况下,如何解析(在 C# 代码中)varchar 值以获取“数字”(13452)?

您可以使用 Linq:

var number = new String(
       yourString.Skip(2)
                 .SkipWhile(s => s == '0')
                 .TakeWhile(s => Char.IsDigit(s))
                 .ToArray()
          );

您可以使用 RegualarExpressions:

(?:TM|PB)0{0,}(\d+)

像这样:

string input = "For example: TM000013452S20548, PB000013452S3DVSF.";
var matches = Regex.Matches(input, @"(?:TM|PB)0{0,}(\d+)");
foreach(Match m in matches)
    Console.WriteLine(int.Parse(m.Groups[1].Value));  

现场演示

如果所有字段都是固定宽度,并且您只关心第一个整数,那么这很容易; 只需使用string.Substring提取您关心的部分然后解析它。

以下是提取和解析的方法(请注意,我使用的是int.TryParse - 您正在解析可能已损坏的字符串):

private bool TryExtractFirstNumber(string input, out int result)
{
    var resultString = input.Substring(2, 9);
    return int.TryParse(resultString, out result);
}

你可以这样称呼它:

var inputs = new[]
{
    "TM000013452S20548",
    "PB000013452S3DVSF",
};
foreach (var inp in inputs)
{
    if (TryExtractFirstNumber(inp, out var result))
    {
        Debug.WriteLine(result);
    }
}

输出是:

13452
13452

如果你描述的“非数字字符”的位置不知道,去寻找它:

private int FindIndexOfFirstNonNumeric(string toScan, int startIndex = 0)
{
    for (var index = startIndex; index < toScan.Length; ++index)
    {
        if (!char.IsNumber(toScan[index]))
        {
            return index;
        }
    }

    return toScan.Length;
}

然后修改TryExtractFirstNumber函数以查找它:

private bool TryExtractFirstNumber(string input, out int result)
{
    var length = FindIndexOfFirstNonNumeric(input, 2) - 2;
    var resultString = input.Substring(2, length);
    return int.TryParse(resultString, out result);
}

它给出了相同的结果。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM