5

我被要求生成一份报告,该报告由针对 SQL Server 数据库的相当复杂的 SQL 查询驱动。由于报告的站点已经在使用 Entity Framework 4.1,我想我会尝试使用 EF 和 LINQ 编写查询:

var q = from r in ctx.Responses
                    .Where(x => ctx.Responses.Where(u => u.UserId == x.UserId).Count() >= VALID_RESPONSES)
                    .GroupBy(x => new { x.User.AwardCity, x.Category.Label, x.ResponseText })
         orderby r.FirstOrDefault().User.AwardCity, r.FirstOrDefault().Category.Label, r.Count() descending
         select new
         {
             City = r.FirstOrDefault().User.AwardCity,
             Category = r.FirstOrDefault().Category.Label,
             Response = r.FirstOrDefault().ResponseText,
             Votes = r.Count()
         };

此查询统计投票,但仅来自已提交一定数量的所需最低投票的用户。

从性能的角度来看,这种方法完全是一场灾难,因此我们切换到 ADO.NET 并且查询运行得非常快。我确实使用 SQL Profiler 查看了 LINQ 生成的 SQL,虽然它看起来像往常一样糟糕,但我没有看到任何关于如何优化 LINQ 语句以使其更高效的线索。

这是直接的 TSQL 版本:

WITH ValidUsers(UserId)
AS
(
    SELECT UserId
    FROM Responses
    GROUP BY UserId
    HAVING COUNT(*) >= 103
)
SELECT d.AwardCity
    , c.Label
    , r.ResponseText
    , COUNT(*) AS Votes
FROM ValidUsers u
JOIN Responses r ON r.UserId = u.UserId
JOIN Categories c ON r.CategoryId = c.CategoryId
JOIN Demographics d ON r.UserId = d.Id
GROUP BY d.AwardCity, c.Label, r.ResponseText
ORDER BY d.AwardCity, s.SectionName, COUNT(*) DESC

我想知道的是:这个查询对于 EF 和 LINQ 来说是否太复杂而无法有效处理,还是我错过了一个技巧?

4

2 回答 2

4

使用 let 减少 r.First() 的数量可能会提高性能。这可能还不够。

 var q = from r in ctx.Responses
                .Where()
                .GroupBy()
     let response = r.First()
     orderby response.User.AwardCity, response.Category.Label, r.Count() descending
     select new
     {
         City = response.User.AwardCity,
         Category = response.Category.Label,
         Response = response.ResponseText,
         Votes = r.Count()
     };
于 2013-01-18T01:23:25.573 回答
1

也许这个改变提高了性能,删除了 where 子句中生成的嵌套 sql select

首先获取每个用户的选票,并将其放入一个Dictionary

var userVotes = ctx.Responses.GroupBy(x => x.UserId )
                             .ToDictionary(a => a.Key.UserId,  b => b.Count());

var cityQuery = ctx.Responses.ToList().Where(x => userVotes[x.UserId] >= VALID_RESPONSES)
               .GroupBy(x => new { x.User.AwardCity, x.Category.Label, x.ResponseText })
               .Select(r => new
                       {
                           City = r.First().User.AwardCity,
                           Category = r.First().Category.Label,
                           Response = r.First().ResponseText,
                           Votes = r.Count()
                       })
               .OrderByDescending(r => r.City, r.Category, r.Votes());
于 2013-01-18T01:01:06.277 回答