Linq扩展集操作

Question

现在的情况：

HashSet<string> MasterSet => {100, 3}

HashSet <string> SubSet => {100, 3} or {100} or {100, 3, 1}

因此，从庞大的子集列表中，基于MasterSet，我选择了这样的特定集合：

if(MasterSet.SetEquals(subSet) || MasterSet.IsSupersetOf(subSet) || MasterSet.IsSubsetOf(subSet))

如果为true，则使用该subSet进行处理，否则循环遍历其他可用集合。

重复项的问题：如果业务逻辑要在主集和子集中包含重复项，例如：

MasterSet => {100, 3, 3}

SubSet => {100, 3, 3} or {100, 3} or {100, 3, 3, 1}

那么HashSet的使用将被剥夺。

如果我将MasterSet和Subset更改为List<string>如何选择子集

编辑：由“ BigYellowCactus”提供的解决方案。 但是，如果我想使用标头而不是元素的顺序进行匹配，是否更容易过滤集合？

MasterSet => {100, 3, 4}
MasterHeaders => {"T","F","V"} //Headers element corresponds to the MasterSet element

情况1：

SubSet => {3, 100}
SubSetHeaders => {"F", "T"} //Headers element corresponds to the SubSet element

情况2：

SubSet => {4, 3}
SubSetHeaders => {"V", "F"} //Headers element corresponds to the SubSet element

是否可以首先通过比较MasterHeaders和SubSetHeaders的标题进行匹配，然后再按值进行匹配？

Answer 1

您可以使用全部扩展方法。

描述

确定序列中的所有元素是否都满足条件。

例：

if (MasterSet.All(e => SubSet.Contains(e)) || SubSet.All(e => MasterSet.Contains(e)))
{
    //do stuff
}

选择：

if (!MasterSet.Except(SubSet).Any() || !SubSet.Except(MasterSet).Any())
{
    //do stuff
}

编辑：

正如Iridium在其评论中指出的那样，对于您想要SubSet { 100, 3, 3 }与MasterSet = { 100, 100, 3 } SubSet { 100, 3, 3 } 不匹配的情况，您可以简单地计算每个元素的出现。

if (MasterSet.All(e => MasterSet.Count(r => r==e) <= SubSet.Count(r => r==e))
    || SubSet.All(e => SubSet.Count(r => r==e) <= MasterSet.Count(r => r==e)))
{
    //do stuff
}

（请注意，这可能不是最有效的方法...）

编辑2：

假设您基本上是在序列中搜索序列，则可以使用以下方法：

void Main()
{
    var MasterSet = new List<string>() {"100", "3","4"};

    var SubSets = new[] 
    {
        new List<string>() {"100", "100", "3"},
        new List<string>() {"100", "3", "4"},
        new List<string>() {"32", "3423", "4234", "100", "3", "4", "34234"},
        new List<string>() {"100", "32", "3423", "4234", "100", "3", "4", "34234"},
        new List<string>() {"100", "32", "3", "4234", "100", "4", "34234"},
        new List<string>() {"100", "4", "3"},
        new List<string>() {"100", "3", "3"},
        new List<string>() {"100", "3"},
        new List<string>() {"100", "3", "3", "1"}
    };

    foreach (var SubSet in SubSets)
    {
        if (IsMatch(MasterSet, SubSet))
            Console.WriteLine(String.Join(", ", SubSet) + " is a \"subset\"");
        else if (IsMatch(SubSet, MasterSet))
            Console.WriteLine(String.Join(", ", SubSet) + " is a \"superset\"");
    }
}

bool IsMatch<T>(IEnumerable<T> source, IEnumerable<T> to_test)
{
    using (var enumerator = source.GetEnumerator())
    using (var sub_enumerator = to_test.GetEnumerator())
        while (sub_enumerator.MoveNext())
        {
            if (!enumerator.MoveNext())
                return false;
            if (!enumerator.Current.Equals(sub_enumerator.Current))
                sub_enumerator.Reset();
        }
    return true;
}

输出：

100、3、4是一个“子集”
32、3423、4234、100、3、4、34234是“超集”
100、32、3423、4234、100、3、4、34234是“超集”
100、3是“子集”

Answer 2

ISet<T>的当前框架实现是HashSet<T>和SortedSet<T> 。 这两个类都强制成员唯一，并且不允许重复。

虽然这乍看起来似乎是框架中的遗漏，但实际上与数学集的属性和定义有关。 正如在解释这个帖子，数学集没有重复成员和logicaly {100, 3}相当于{100, 3, 3}.

可以扩展List<T>来实现ISet<T> ，也许可以调用新类Sack<T>但是ISet<T>的非唯一实现将比框架中现有的更具挑战性，无需过多考虑，似乎使人联想到一般的背包问题。

Linq扩展集操作

问题描述

2 个解决方案

解决方案1
1 已采纳 2012-07-25 10:57:58

解决方案2
0 2012-07-25 11:02:54

Linq扩展集操作

问题描述

2 个解决方案

解决方案1 1 已采纳 2012-07-25 10:57:58

解决方案2 0 2012-07-25 11:02:54

解决方案1
1 已采纳 2012-07-25 10:57:58

解决方案2
0 2012-07-25 11:02:54