[英]Entity Framework Performance Issue
我遇到了Entity Framework的一个有趣的性能问题。 我正在使用Code First。
这是我的实体的结构:
一本书可以有很多评论。 评论与单本书相关联。 评论可以有一个或多个评论。 评论与一篇评论相关联。
public class Book
{
public int BookId { get; set; }
// ...
public ICollection<Review> Reviews { get; set; }
}
public class Review
{
public int ReviewId { get; set; }
public int BookId { get; set; }
public Book Book { get; set; }
public ICollection<Comment> Comments { get; set; }
}
public class Comment
{
public int CommentId { get; set; }
public int ReviewId { get; set; }
public Review Review { get; set; }
}
我用大量数据填充了我的数据库并添加了适当的索引。 我正在尝试使用此查询检索一本包含10,000条评论的图书:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.FirstOrDefault();
这本特别的书有10,000条评论。 此查询的性能约为4秒。 运行完全相同的查询(通过SQL事件探查器)实际上很快就会返回。 我使用相同的查询和SqlDataAdapter以及自定义对象来检索数据,它发生在500毫秒以内。
使用ANTS Performance Profiler看起来大部分时间花在做一些不同的事情上:
Equals方法被称为5000万次。
有谁知道为什么需要调用这5000万次以及如何才能提高性能呢?
为什么Equals被称为50M次?
这听起来很可疑。 您有10,000条评论和50.000.000次调用Equals
。 假设这是由EF内部实现的身份映射引起的。 身份映射确保上下文仅跟踪具有唯一键的每个实体一次,因此如果上下文已经具有与来自数据库的加载记录具有相同键的实例,则它将不实现新实例而是使用现有实例。 现在这又如何与这些数字相吻合? 我可怕的猜测:
=============================================
1st record read | 0 comparisons
2nd record read | 1 comparison
3rd record read | 2 comparisons
...
10.000th record read | 9.999 comparisons
这意味着将每个新记录与身份映射中的每个现有记录进行比较。 通过应用数学计算所有比较的总和,我们可以使用称为“算术序列”的东西:
a(n) = a(n-1) + 1
Sum(n) = (n / 2) * (a(1) + a(n))
Sum(10.000) = 5.000 * (0 + 9.999) => 5.000 * 10.000 = 50.000.000
我希望我的假设或计算没有错。 等待! 我希望我错了,因为这似乎并不好。
尝试关闭更改跟踪=希望关闭身份地图检查。
这可能很棘手。 从...开始:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.AsNoTracking()
.FirstOrDefault();
但是很有可能您的导航属性不会被填充(因为它由变更跟踪处理)。 在这种情况下使用这种方法:
var book = db.Books.Where(b => b.BookId == id).AsNoTracking().FirstOrDefault();
book.Reviews = db.Reviews.Where(r => r.BookId == id).AsNoTracking().ToList();
无论如何,你能看到哪些对象类型传递给Equals? 我认为它应该只比较主键,甚至50M整数比较不应该是这样的问题。
作为旁注,EF很慢 - 这是众所周知的事实。 在实现实体时,它还在内部使用反射,因此简单的10.000记录可能需要“一些时间”。 除非您已经这样做,否则还可以关闭动态代理创建( db.Configuration.ProxyCreationEnabled
)。
我知道这听起来有点蹩脚,但你是否尝试过相反的方式,例如:
var reviewsAndBooks = db.Reviews.Where(r => r.Book.BookId == id)
.Include(r => r.Book);
当你以这种方式处理你的查询时,我注意到EF有时会有更好的表现(但我没有时间弄清楚原因)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.