3

我正在尝试从 MySql 返回一个按年和月分组的结果集,并且每个年/月都会返回一个计数。

这是我开始的地方:

SELECT YEAR(p.pEndDate) AS pYear, MONTHNAME(p.pEndDate) AS pMonth, count(*) AS pNum 
FROM projects p
WHERE p.status=3
GROUP BY YEAR(p.pEndDate), MONTH(p.pEndDate)

这个 SQL 基本上完成了我需要的 90%,除非有一个月的计数为零。例如,在 2009 年 7 月,状态为 3 的项目为零,所以我得到:

2008    November    1
2009    January     2
2009    February    2
2009    March   2
2009    April   1
2009    May 2
2009    June    3
2009    August  2
2009    September   1
2009    October 1
2009    November    2
2009    December    1
2010    January 4
2010    February    1
2010    March   1
2010    April   3
2010    May 3
2010    June    3
2010    July    3
2010    August  3
2010    September   3
2010    October 2
2010    November    2
2010    December    3
2011    January 2
2011    February    1

请注意七月是如何不存在的。

所以我开始做一些研究,使用另一个表来强制结果集中包含 7 月。所以我创建了一个新表'monthTable'并添加了两列monthID int Primary Key,monthName VARCHAR(3)。

我已经尝试了许多不同的方法来使用这个表,从 RIGHT JOIN 等等开始。他们都没有产生成功的结果,事实上我所做的几乎所有事情都会产生与上面相同的结果集。

任何帮助将不胜感激!

4

3 回答 3

1

我已经尝试了许多不同的方法来使用这个 [monthTable] 表,从 RIGHT JOIN 开始等等.. 他们都没有产生成功的结果,事实上我所做的几乎所有事情都会产生与上面相同的结果集。

FROM projects p WHERE p.status=3

我的猜测是你正在尝试这样的事情

FROM projects p
RIGHT JOIN monthTable m on <join p to m>
WHERE p.status=3`

问题是 WHERE 子句将过滤掉任何没有任何 p.status 值(null)的记录。您需要将此类过滤器移至 JOIN 子句,如下所示

FROM projects p
RIGHT JOIN monthTable m on <join p to m> AND p.status=3`

很好奇,但是像这样的表如何就足够了,尤其是月名只有 varchar(3)?

monthID int Primary Key, monthName VARCHAR(3).

尝试像这样创建它(一次性)

DROP PROCEDURE IF EXISTS FillMonthsTable;

delimiter //
CREATE PROCEDURE FillMonthsTable()
    LANGUAGE SQL
    NOT DETERMINISTIC
    CONTAINS SQL
    SQL SECURITY DEFINER
    COMMENT ''
BEGIN
  drop table if exists monthsTable;
  create table monthsTable (theYear int, theMonth int, monthName varchar(20));

  SET @x := date('2000-01-01');
  REPEAT 
    insert into monthsTable (theyear, themonth, monthname) SELECT year(@x), month(@x), monthname(@x);
    SET @x := date_add(@x, interval 1 month);
    UNTIL @x > date('2030-01-01') END REPEAT;
END//
delimiter ;

CALL FillMonthsTable;

DROP PROCEDURE FillMonthsTable;

然后使用此查询(1-pass 对您的数据进行分组,然后使用左连接生成 0)

SELECT m.theYear, m.theMonth, IFNULL(t.pNum, 0) theCount
FROM monthsTable m
LEFT JOIN (
    SELECT YEAR(p.pEndDate) AS pYear, MONTH(p.pEndDate) AS pMonth, count(*) AS pNum 
    FROM projects p
    WHERE p.status=3
    GROUP BY YEAR(p.pEndDate), MONTH(p.pEndDate)
) t on t.pYear = m.theYear and t.pMonth = m.theMonth
ORDER BY m.theYear, m.theMonth
于 2011-03-01T18:39:27.230 回答
0

扩展 OMG Ponies 语句,您需要一个 Numbers 或 Tally 表,其中包含一个连续的整数列表,涵盖您要查询的所有年份的月份和年份。

Create Table Numbers ( Value int not null Primary Key )
Insert Numbers(Value) Values( 1 )
Insert Numbers(Value) Values( 2 )
...
Insert Numbers(Value) Values( 12 )
...
Insert Numbers(Value) Values( 2000 )
Insert Numbers(Value) Values( 2001 )
...
Insert Numbers(Value) Values( 2011 )
Insert Numbers(Value) Values( 2012 )

这将是一次性插入,并且该表将保持静态,直到您需要更多月或数年。有了这个,我们现在将您的 Projects 表左连接到 Numbers 表:

Select Years.Value As PYear
    , Month_Name( Date_Add('2000-01-01', Interval Months.Value - 1 MONTH) ) As PMonth
    , Count( P.NonNullableCol ) As PNum
From Numbers As Months
    Cross Join Numbers As Years
    Left Join Projects As P
        On Year( P.PEnddate ) = Years.Value
            And Month( P.PEndDate ) = Months.Value
Where Months.Value Between 1 And 12
    And Years.Value Between 2008 And 2011
Group By Years.Value, Months.Value

添加

根据评论,我们没有被告知基础数据的性质。但是,如果所讨论的值是日期而不是日期和时间,那么更快的方法是日历表而不是数字表。与 Numbers 表一样,这将是一个包含 Projects 表中日期时间段的连续日期静态表。

Create Table Calendar ( DateValue date not null Primary Key )
Insert Calendar( DateValue ) Values( '2000-01-01' )
Insert Calendar( DateValue ) Values( '2000-01-02' )
Insert Calendar( DateValue ) Values( '2000-01-03' )
...
Insert Calendar( DateValue ) Values( '2011-03-01' )

Select Year( C.DateValue ) As PYear
    , Month( C.DateValue ) As PMonth
    , Count( P.NonNullableCol ) As PNum
From Calendar As C
    Left Join Projects As P
        On P.PEndDate = C.DateValue
Where C.DateValue Between '2008-11-01' And '2011-02-28'
Group By Year( C.DateValue ), Month( C.DateValue )
于 2011-03-01T18:23:31.850 回答
0

如果您有一个使用 0 到 9 整数调用的辅助表nums,您可以生成任何类型的完整序列。您的问题不是日期值的计数为空,而是日期值根本不存在。因此,假设您想要 2004 年 1 月到 2006 年 3 月之间的每月计数,您可以使用如下nums表格创建一个临时日期列表:

SELECT DISTINCT ADDDATE('2004-01-01',INTERVAL i.i+j.i+k.i MONTH) AS mydate
FROM nums i JOIN nums j  JOIN nums k ORDER BY mydate LIMIT 27;

然后如其他地方所述,您将真实数据加入日期列表 ON(年 = 年和月 = 月)。

这是在我自己的表 (msds) 上完成的类似查询,用于说明:

select year(mydate) theyear, monthname(mydate) themonth, coalesce(c,0) thecount
from

(select DISTINCT adddate('2004-01-01',INTERVAL i.i+j.i+k.i MONTH) as mydate
FROM ints i  JOIN ints j  join ints k ORDER BY mydate LIMIT 27) datelist

left join

(SELECT year(issue_date) as y, month(issue_date) as m, count(*) c FROM msds m where issue_date between '2004-01-01' and '2006-03-01'
group by y, m) mydata

on (year(mydate)=y and month(mydate)=m)
于 2011-03-01T18:29:30.220 回答