[英]Extract number from string value
我有一个总是采用这种格式的字符串:
"TM" + 多个前导 0 + 数字 + 非数字字符 + 字母数字。
例如:TM000013452S20548、PB000013452S3DVSF。
在这种情况下,如何解析(在 C# 代码中)varchar 值以获取“数字”(13452)?
您可以使用 Linq:
var number = new String(
yourString.Skip(2)
.SkipWhile(s => s == '0')
.TakeWhile(s => Char.IsDigit(s))
.ToArray()
);
您可以使用 RegualarExpressions:
(?:TM|PB)0{0,}(\d+)
像这样:
string input = "For example: TM000013452S20548, PB000013452S3DVSF.";
var matches = Regex.Matches(input, @"(?:TM|PB)0{0,}(\d+)");
foreach(Match m in matches)
Console.WriteLine(int.Parse(m.Groups[1].Value));
如果所有字段都是固定宽度,并且您只关心第一个整数,那么这很容易; 只需使用string.Substring
提取您关心的部分然后解析它。
以下是提取和解析的方法(请注意,我使用的是int.TryParse
- 您正在解析可能已损坏的字符串):
private bool TryExtractFirstNumber(string input, out int result)
{
var resultString = input.Substring(2, 9);
return int.TryParse(resultString, out result);
}
你可以这样称呼它:
var inputs = new[]
{
"TM000013452S20548",
"PB000013452S3DVSF",
};
foreach (var inp in inputs)
{
if (TryExtractFirstNumber(inp, out var result))
{
Debug.WriteLine(result);
}
}
输出是:
13452
13452
如果你描述的“非数字字符”的位置不知道,去寻找它:
private int FindIndexOfFirstNonNumeric(string toScan, int startIndex = 0)
{
for (var index = startIndex; index < toScan.Length; ++index)
{
if (!char.IsNumber(toScan[index]))
{
return index;
}
}
return toScan.Length;
}
然后修改TryExtractFirstNumber
函数以查找它:
private bool TryExtractFirstNumber(string input, out int result)
{
var length = FindIndexOfFirstNonNumeric(input, 2) - 2;
var resultString = input.Substring(2, length);
return int.TryParse(resultString, out result);
}
它给出了相同的结果。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.