我遇到了 Entity Framework 的一个有趣的性能问题。我正在使用代码优先。
这是我的实体的结构:
一本书可以有很多评论。评论与一本书相关联。评论可以有一个或多个评论。一条评论与一条评论相关联。
public class Book
{
public int BookId { get; set; }
// ...
public ICollection<Review> Reviews { get; set; }
}
public class Review
{
public int ReviewId { get; set; }
public int BookId { get; set; }
public Book Book { get; set; }
public ICollection<Comment> Comments { get; set; }
}
public class Comment
{
public int CommentId { get; set; }
public int ReviewId { get; set; }
public Review Review { get; set; }
}
我用大量数据填充了我的数据库并添加了适当的索引。我正在尝试使用以下查询检索一本包含 10,000 条评论的书:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.FirstOrDefault();
这本书有 10,000 条评论。此查询的执行时间约为 4 秒。运行完全相同的查询(通过 SQL Profiler)实际上很快就会返回。我使用相同的查询和一个 SqlDataAdapter 和自定义对象来检索数据,它发生在 500 毫秒内。
使用 ANTS Performance Profiler 看起来大部分时间都花在了做一些不同的事情上:
Equals 方法被调用了 5000 万次。
有谁知道为什么需要调用 5000 万次以及如何提高性能?