[英]Best way to compare two Dictionary<T> for equality
这是为两个词典的相等性创建比较器的最佳方法吗? 这需要准确。 请注意,Entity.Columns是KeyValuePair的字典(字符串,对象):
public class EntityColumnCompare : IEqualityComparer<Entity>
{
public bool Equals(Entity a, Entity b)
{
var aCol = a.Columns.OrderBy(KeyValuePair => KeyValuePair.Key);
var bCol = b.Columns.OrderBy(KeyValuePAir => KeyValuePAir.Key);
if (aCol.SequenceEqual(bCol))
return true;
else
return false;
}
public int GetHashCode(Entity obj)
{
return obj.Columns.GetHashCode();
}
}
对GetHashCode实现也不太确定。
谢谢!
这就是我要做的事情:
public bool Equals(Entity a, Entity b)
{
if (a.Columns.Count != b.Columns.Count)
return false; // Different number of items
foreach(var kvp in a.Columns)
{
object bValue;
if (!b.Columns.TryGetValue(kvp.Key, out bValue))
return false; // key missing in b
if (!Equals(kvp.Value, bValue))
return false; // value is different
}
return true;
}
这样您就不需要对条目进行排序(这是一个O(n log n)操作):您只需要枚举第一个字典中的条目( O(n) )并尝试按键中的键检索值。第二个字典( O(1) ),因此总体复杂度为O(n) 。
另请注意,您的GetHashCode
方法不正确:在大多数情况下,它会为不同的字典实例返回不同的值,即使它们具有相同的内容。 如果哈希码不同,则永远不会调用Equals
...您有几个选项可以正确实现它,它们都不是理想的:
GetHashCode
需要很快 Equals
:如果你想在hashtable / dictionary / hashset中使用这个比较器,那就非常糟糕,因为所有的实例都会落在同一个桶中,导致O(n)访问而不是O(1) Count
(由digEmAll建议):它不会给出很好的分布,但仍然比总是返回相同的值更好,并且它满足GetHashCode
的约束(即被认为相等的对象应该具有相同的hashcode;两个“相等”的词典具有相同数量的项目,因此它可以工作) 想到这样的事情,但可能会有更高效的东西:
public static bool Equals<TKey, TValue>(IDictionary<TKey, TValue> x,
IDictionary<TKey, TValue> y)
{
return x.Keys.Intersect(y.Keys).Count == x.Keys.Count &&
x.Keys.All(key => Object.Equals(x[key], y[key]));
}
这对我来说似乎不错,也许不是最快但有效的。
您只需要更改错误的GetHashCode
实现。
例如,您可以返回obj.Columns.Count.GetHashCode()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.