繁体   English   中英

比较两个字符串中的字符

[英]compare the characters in two strings

在C#中,如何比较两个字符串中的字符。
例如,假设我有这两个字符串
“ bc3231dsc”和“ bc3462dsc”

如何以编程方式找出字符串
都以“ bc3”开头并以“ dsc”结尾?

因此,给定的将是两个变量:

var1 = "bc3231dsc";  
var2 = "bc3462dsc";  

比较从var1到var2的每个字符后,我希望输出为:

leftMatch = "bc3";  
center1 = "231";  
center2 = "462";  
rightMatch = "dsc";  

条件:
1.字符串的长度始终为9个字符。
2.字符串不区分大小写。

字符串类可以使用2种方法(StartsWith和Endwith)。

在阅读了您的问题和已经给出的答案之后,我认为缺少一些约束,这些约束可能对您来说很明显,但对社区而言却不是。 但是也许我们可以做一些猜测工作:

  1. 您将有一堆应该比较的字符串对。
  2. 每对中的两个字符串长度相同,或者您只对比较从左到右同时读取的字符感兴趣。
  3. 得到某种枚举,它告诉我每个块从哪里开始以及它有多长时间。

由于事实,字符串只是char的枚举,您可以在此处使用LINQ来了解匹配字符,如下所示:

private IEnumerable<bool> CommonChars(string first, string second)
{
    if (first == null)
        throw new ArgumentNullException("first");

    if (second == null)
        throw new ArgumentNullException("second");

    var charsToCompare = first.Zip(second, (LeftChar, RightChar) => new { LeftChar, RightChar });
    var matchingChars = charsToCompare.Select(pair => pair.LeftChar == pair.RightChar);

    return matchingChars;
}

有了这个,我们可以继续进行,现在找出使用此方法的每个连续的true和false标志块有多长时间:

private IEnumerable<Tuple<int, int>> Pack(IEnumerable<bool> source)
{
    if (source == null)
        throw new ArgumentNullException("source");

    using (var iterator = source.GetEnumerator())
    {
        if (!iterator.MoveNext())
        {
            yield break;
        }

        bool current = iterator.Current;
        int index = 0;
        int length = 1;

        while (iterator.MoveNext())
        {
            if(current != iterator.Current)
            {
                yield return Tuple.Create(index, length);
                index += length;
                length = 0;
            }

            current = iterator.Current;
            length++;
        }

        yield return Tuple.Create(index, length);
    }
}

目前,我不知道是否已经存在提供相同功能的LINQ功能。 据我所读, SelectMany()应该是可能的SelectMany()理论上,您可以使用此方法完成任何LINQ任务),但是作为一个即席实现,以上操作(对我来说)更容易。

然后可以按以下方式使用这些功能:

var firstString = "bc3231dsc";
var secondString = "bc3462dsc";

var commonChars = CommonChars(firstString, secondString);
var packs = Pack(commonChars);

foreach (var item in packs)
{
    Console.WriteLine("Left side:  " + firstString.Substring(item.Item1, item.Item2));
    Console.WriteLine("Right side: " + secondString.Substring(item.Item1, item.Item2));
    Console.WriteLine();
}

然后您将向哪个输出:

左侧:bc3右侧:bc3

左侧:231右侧:462

左侧:dsc右侧:dsc

最大的缺点是在某种程度上使用了Tuple因为它导致了丑陋的属性名称Item1Item2 ,而这些属性名称远不能立即读取。 但是,如果真的需要,可以引入一个拥有两个整数的简单类,并具有一些坚如磐石的属性名称。 同样,当前丢失了有关两个块是否共享每个块或它们是否不同的信息。 但是,再次将这些信息也带入元组或您自己的班级应该相当简单。

    static void Main(string[] args)
    {
        string test1 = "bc3231dsc";
        string tes2 = "bc3462dsc";
        string firstmatch = GetMatch(test1, tes2, false);
        string lasttmatch = GetMatch(test1, tes2, true);
        string center1 = test1.Substring(firstmatch.Length, test1.Length -(firstmatch.Length + lasttmatch.Length)) ;
        string center2 = test2.Substring(firstmatch.Length, test1.Length -(firstmatch.Length + lasttmatch.Length)) ;

    }

    public static string GetMatch(string fist, string second, bool isReverse)
    {
        if (isReverse)
        {
            fist = ReverseString(fist);
            second = ReverseString(second);
        }
        StringBuilder builder = new StringBuilder();
        char[] ar1 = fist.ToArray();
        for (int i = 0; i < ar1.Length; i++)
        {
            if (fist.Length > i + 1 && ar1[i].Equals(second[i]))
            {
                builder.Append(ar1[i]);
            }
            else
            {
                break;
            }
        }
        if (isReverse)
        {
            return ReverseString(builder.ToString());
        }
        return builder.ToString();
    }

    public static string ReverseString(string s)
    {
        char[] arr = s.ToCharArray();
        Array.Reverse(arr);
        return new string(arr);
    }

您需要的伪代码..

int stringpos = 0
string resultstart = ""
while not end of string (either of the two)
{
if string1.substr(stringpos) == string1.substr(stringpos) 
resultstart =resultstart + string1.substr(stringpos)
else
exit while
}

resultstart有您开始的字符串..您可以执行相同的倒退...

您可以使用的另一个解决方案是正则表达式。

Regex re = new Regex("^bc3.*?dsc$");
String first = "bc3231dsc";
if(re.IsMatch(first)) {
    //Act accordingly...
}

匹配时可以为您提供更大的灵活性。 上面的模式匹配以bc3开始并以dsc结尾的任何字符串,除了换行符外,其他任何字符串之间都应匹配。 通过更改。*? 到\\ d,可以指定两个字段之间只希望数字。 从那里开始,无限的可能性。

using System;
using System.Text.RegularExpressions;
using System.Collections.Generic;

class Sample {
    static public void Main(){
        string s1 = "bc3231dsc";
        string s2 = "bc3462dsc";
        List<string> common_str = commonStrings(s1,s2);
        foreach ( var s in common_str)
            Console.WriteLine(s);
    }
    static public List<string> commonStrings(string s1, string s2){
        int len = s1.Length;
        char [] match_chars = new char[len];
        for(var i = 0; i < len ; ++i)
            match_chars[i] = (Char.ToLower(s1[i])==Char.ToLower(s2[i]))? '#' : '_';
        string pat = new String(match_chars);
        Regex regex = new Regex("(#+)", RegexOptions.Compiled);
        List<string> result = new List<string>();
        foreach (Match match in regex.Matches(pat))
            result.Add(s1.Substring(match.Index, match.Length));
        return result;
    }
}

更新条件

using System;

class Sample {
    static public void Main(){
        string s1 = "bc3231dsc";
        string s2 = "bc3462dsc";
        int len = 9;//s1.Length;//cond.1)
        int l_pos = 0;
        int r_pos = len;
        for(int i=0;i<len && Char.ToLower(s1[i])==Char.ToLower(s2[i]);++i){
            ++l_pos;
        }
        for(int i=len-1;i>0 && Char.ToLower(s1[i])==Char.ToLower(s2[i]);--i){
            --r_pos;
        }
        string leftMatch = s1.Substring(0,l_pos);
        string center1 = s1.Substring(l_pos, r_pos - l_pos);
        string center2 = s2.Substring(l_pos, r_pos - l_pos);
        string rightMatch = s1.Substring(r_pos);
        Console.Write(
        "leftMatch = \"{0}\"\n" +
        "center1 = \"{1}\"\n" +
        "center2 = \"{2}\"\n" +
        "rightMatch = \"{3}\"\n",leftMatch, center1, center2, rightMatch);
    }
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM