9

我有一个 django 应用程序正在做一些日志记录。我的模型如下所示:

class MessageLog(models.Model):
    logtime = models.DateTimeField(auto_now_add=True)
    user = models.CharField(max_length=50)
    message = models.CharField(max_length=512)

想要做的是获取一周中每天记录的平均消息数,以便我可以看到哪些日子最活跃。我设法编写了一个查询,该查询每天提取消息总数,即:

for i in range(1, 8):
    MessageLog.objects.filter(logtime__week_day=i).count()

但是我在计算查询中的平均值时遇到了麻烦。我现在拥有的是:

for i in range(1, 8):
    MessageLog.objects.filter(logtime__week_day=i).annotate(num_msgs=Count('id')).aggregate(Avg('num_msgs'))

出于某种原因,这每天都会返回 1.0。我查看了它正在生成的 SQL,它是:

SELECT AVG(num_msgs) FROM (
SELECT 
`myapp_messagelog`.`id` AS `id`, `myapp_messagelog`.`logtime` AS `logtime`, 
`myapp_messagelog`.`user` AS `user`, `myapp_messagelog`.`message` AS `message`, 
COUNT(`myapp_messagelog`.`id`) AS `num_msgs` 
FROM `myapp_messagelog` 
WHERE DAYOFWEEK(`myapp_messagelog`.`logtime`) = 1 
GROUP BY `myapp_messagelog`.`id` ORDER BY NULL
) subquery

我认为问题可能来自 GROUP BY id,但我不太确定。有人有什么想法或建议吗?提前致谢!

4

3 回答 3

10

您列出的查询总是给出 1 的原因是因为您没有按日期分组。基本上,您已经要求数据库获取MessageLog一周中给定日期的行。对于每个这样的行,计算它有多少个 id(总是 1)。然后取所有这些计数的平均值,当然也是 1。

通常,您需要在您的和部分之前使用values子句对行进行分组。但是,由于您的字段是日期时间而不仅仅是日期,我不确定您是否可以直接使用 Django 的 ORM 来表达。您绝对可以使用子句来做到这一点如此处所示。或者,如果您愿意,可以在 SQL 中声明一个视图,其中包含您喜欢的聚合和平均数学,并为它声明一个非托管模型,然后正常使用 ORM。MessageLogannotateaggregatelogtimeextra

因此,一个extra字段可以获取实际每天的记录总数,但不处理聚合计算注释的平均值。我认为这可能已经从您必须使用原始 SQL 查询的模型中充分抽象出来,或者至少我找不到任何可以让它在一次调用中工作的东西。

也就是说,您已经知道如何在问题中显示的简单查询中获取每个工作日的记录总数。

此查询将告诉您给定工作日有多少不同的日期记录:

MessageLog.objects.filter(logtime__week_day=i).dates('logtime', day').count()

因此,您可以改为在 Python 中进行平均数学运算,这可能比尝试正确使用 SQL 更简单。

或者,此查询将在一个查询而不是 for 循环中为您提供所有工作日的原始消息数:

MessageLog.objects.extra({'weekday': "dayofweek(logtime)"}).values('weekday').annotate(Count('id'))

但是我无法获得一个很好的查询来为您提供每个工作日注释的不同日期的计数 - 日期查询集失去了处理注释调用的能力,并且对一个extra值进行注释似乎也不起作用。

这出乎意料地棘手,因为 SQL 表达式并不难。

于 2013-05-31T04:46:39.533 回答
5

我对日期时间字段做了类似的事情,但是对额外的值进行注释确实对我有用。我有一个记录模型,其中包含一个日期时间字段“created_at”和一个“my_value”字段,我想获得平均值。

from django.db.models import Avg

qs = Record.objects.extra({'created_day':"date(created_at)"}).\
    values('created_day').\
    annotate(count=Avg('my_value'))

以上将按“created_at”字段中日期时间值的日期分组。

于 2013-08-25T20:19:47.343 回答
1
queryset.extra(select={'day': 'date(logtime)'}).values('day').order_by('-day').annotate(Count('id'))
于 2019-12-23T10:42:53.963 回答