繁体   English   中英

从列表中删除顺序重复项 <T> 使用LINQ

[英]Removing sequential repeating items from List<T> using linq

我正在寻找一种方法来防止重复列表中的项目,但仍保留订单。 例如

1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 

应该成为

1, 2, 3, 4, 1, 2, 3, 4

我使用for循环非常出色地完成了此任务,如下检查下一项

    public static List<T> RemoveSequencialRepeats<T>(List<T> input) 
    {
        var result = new List<T>();

        for (int index = 0; index < input.Count; index++)
        {
            if (index == input.Count - 1)
            {
                result.Add(input[index]);
            }
            else if (!input[index].Equals(input[index + 1]))
            {
                result.Add(input[index]);
            }
        }

        return result;
    }

是否有更优雅的方法(最好是使用LINQ)来做到这一点?

您可以创建扩展方法:

public static IEnumerable<T> RemoveSequentialRepeats<T>(
      this IEnumerable<T> source)
{
    using (var iterator = source.GetEnumerator())
    {
        var comparer = EqualityComparer<T>.Default;

        if (!iterator.MoveNext())
            yield break;

        var current = iterator.Current;
        yield return current;

        while (iterator.MoveNext())
        {
            if (comparer.Equals(iterator.Current, current))
                continue;

            current = iterator.Current;
            yield return current;
        }
    }        
}

用法:

var result = items.RemoveSequentialRepeats().ToList();

您也可以使用纯LINQ

List<int> list = new List<int>{1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4};
var result = list.Where((x, i) => i == 0 || x != list[i - 1]);

您可以编写简单的LINQ:

var l = new int[] { 1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 };
var k = new Nullable<int>();
var nl = l.Where(x => { var res = x != k; k = x; return res; }).ToArray();

int[8] { 1, 2, 3, 4, 1, 2, 3, 4 }

或pythonic(嗯,我最好的尝试)方式:

l.Zip(l.Skip(1), (x, y) => new[] { x, y })
   .Where(z => z[0] != z[1]).Select(a => a[0])
   .Concat(new[] { l[l.Length - 1] }).ToArray()

int[8] { 1, 2, 3, 4, 1, 2, 3, 4 }

最简单的( 编辑:还没有看到它已经由King King建议)

l.Where((x, i) => i == l.Length - 1 || x != l[i + 1]).ToArray()
int[8] { 1, 2, 3, 4, 1, 2, 3, 4 }

如果您希望LINQ语句不依赖于调用内部结果的捕获值,则将需要一些带有聚合的构造,因为它是唯一带有值和操作的方法。 即基于Zaheer Ahmed的代码:

array.Aggregate(new List<string>(), 
     (items, element) => 
     {
        if (items.Count == 0 || items.Last() != element)
        {
            items.Add(element);
        }
        return items;
     });

或者你甚至可以尝试建立名单没有if

 array.Aggregate(Enumerable.Empty<string>(), 
    (items, element) => items.Concat(
       Enumerable.Repeat(element, 
           items.Count() == 0 || items.Last() != element ? 1:0 ))
    );

请注意,要使用Aggregate获得上述样本的合理性能,您还需要携带last值( Last必须在每个步骤上迭代整个序列),但是在Tuple中携带3个值{IsEmpty, LastValue, Sequence}代码非常{IsEmpty, LastValue, Sequence}看起来很奇怪。 这些样本仅用于娱乐目的。

另一种选择是对Zip数组进行位移1并返回不相等的元素...

更实用的选择是构建用于过滤值的迭代器:

IEnumerable<string> NonRepeated(IEnumerable<string> values)
{
    string last = null;
    bool lastSet = false;

    foreach(var element in values)
    {
       if (!lastSet || last != element)
       {
          yield return element;
       }
       last = element;
       lastSet = true;
    }
 }

如果您真的真的讨厌这个世界,那么请使用LINQ:

var nmbs = new int[] { 1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4, 5 };
var res = nmbs
              .Take(1)
              .Concat(
                      nmbs.Skip(1)
                          .Zip(nmbs, (p, q) => new { prev = q, curr = p })
                          .Where(p => p.prev != p.curr)
                          .Select(p => p.curr));

但是请注意,您需要枚举(至少部分地)可枚举3次( Take ,的“左”的一部分Zip ,第一参数Zip )。 此方法比建立或直接执行yield方法要慢

说明:

  • 您采用第一个数字( .Take(1)
  • 你把所有从第二个数字( .Skip(1)并与所有的数字(配对.Zip(nmbs ),我们将调用curr从最初的“集合”的数量和prev号码从第二“集合”(( (p, q) => new { prev = q, curr = p }) )。 然后,您仅获取与前一个数字( .Where(p => p.prev != p.curr) )不同的数字,然后从这些数字中获取curr值并丢弃prev值( .Select(p => p.curr)
  • 您可以.Concat(这两个集合( .Concat(

检查新列表的最后一个和当前项目是否不相同,然后添加到新列表:

List<string> results = new List<string>();
results.Add(array.First());
foreach (var element in array)
{
    if(results[results.Length - 1] != element)
        results.Add(element);
}

或使用LINQ:

List<int> arr=new List<int>(){1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 };
List<int> result = new List<int>() { arr.First() };
arr.Select(x =>
               {
                if (result[result.Length - 1] != x) result.Add(x);
                    return x;
               }).ToList();

对空对象进行正确的验证。

尝试这个:

class Program
{
    static void Main(string[] args)
    {
        var input = "1, 2, 3, 4, 4, 4, 1, 1, 2, 3, 4, 4 ";
        var list = input.Split(',').Select(i => i.Trim());

        var result = list
            .Select((s, i) => 
                (s != list.Skip(i + 1).FirstOrDefault()) ? s : null)
            .Where(s => s != null)
            .ToList();
    }
}

这是您需要的代码:

public static List<int> RemoveSequencialRepeats(List<int> input)
{
     var result = new List<int>();

     result.Add(input.First());
     result.AddRange(input.Where(p_element => result.Last() != p_element);
     return result;
 }

LINQ的魔力是:

 result.Add(input.First());
 result.AddRange(input.Where(p_element => result.Last() != p_element);

或者您可以创建如下扩展方法:

public static class Program
{

    static void Main(string[] args)
    {       
        List<int> numList=new List<int>(){1,2,2,2,4,5,3,2};

        numList = numList.RemoveSequentialRepeats();
    }

    public static List<T> RemoveSequentialRepeats<T>(this List<T> p_input)
    {
        var result = new List<T> { p_input.First() };

        result.AddRange(p_input.Where(p_element => !result.Last().Equals(p_element)));

        return result;
    }
}

如果您想引用F#项目,可以编写

let rec dedupe = function
  | x::y::rest when x = y -> x::dedupe rest
  | x::rest -> x::dedupe rest
  | _ -> []

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM