繁体   English   中英

规范化两个字符串然后比较

[英]Nomalize Two Strings Then Compare

我有 2 个字符串,它们都是某种参考号(有前缀和数字)。

string a = "R&D123";
string b = "R&D 123";

string astring b是两个不同的用户输入,我试图比较这两个字符串是否匹配。

我知道我可以使用String.Compare()来检查两个字符串是否相同,但就像上面的例子一样,它们可能是不同的字符串,但在技术上是一样的。

因为它们都是用户输入(来自不同用户),所以可以有几种不同的格式。

"R&D123"
"R&D 123" //with space in between
"R.D.123 " //using period or other character
"r&d123" //different case
"RD123" //no special character
...etc

有没有办法我可以先“标准化”两个字符串然后比较它们?

我知道一个易于理解的方法是使用string.Replace()将特殊字符和空格替换为空格并使用string.ToLower()所以我不必担心案例。 但是这种方法的问题是,如果我有很多特殊字符,我会多次执行.Replace() ,这并不理想。

另一个问题是R&D并不是我需要担心的唯一前缀,还有其他前缀,例如APKD等。不确定这是否会有所作为:/

任何帮助表示赞赏,谢谢!

如果您只想输入字母和数字,可以使用 linq:

var array1 = a.Where(x =>char.IsLetterOrDigit(x)).ToArray();
var array2 = b.Where(x => char.IsLetterOrDigit(x)).ToArray();
var normalizedStr1 = new String(array1).ToLower();
var normalizedStr2 = new String(array2).ToLower();

String.Compare(normalizedStr1,normalizedStr2);

这可能不是最漂亮的方法,但它是最快的

   static void Main(string[] args)
    {
        string sampleResult = NormlizeAlphaNumeric("Hello wordl 3242348&&))&)*^&#R&#&R#)R#@)R#@R#R#@");

    }

    public static string NormlizeAlphaNumeric(string someValue)
    {
        var sb = new StringBuilder(someValue.Length);
        foreach (var ch in someValue)
        {
            if(char.IsLetterOrDigit(ch))
            {
                sb.Append(ch);
            }
        }
        return sb.ToString().ToLower();
    }

尝试这个...

string s2 = Regex.Replace(s, @"[^[a-zA-Z0-9]]+", String.Empty);

它将替换所有特殊字符并为您提供规范化字符串。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM