3

我们使用以下 SQL 查询来生成每月平均值。该语句被大量使用并且运行良好,但它每个月或两个月都会失败并出现“ORA-00979:不是 GROUP BY 表达式” ,我们不知道为什么。

先说流程:

  • 我们每隔几分钟就有原始数据,
  • => 原始数据被平均为每小时、每天、每月和每年的值

原始 -> 每小时

  • 在 average_type 2 的平均值表中创建条目
  • 从来没有问题

每小时 => 每天 / 每天 => 每月 / 每月 => 每年

  • 语句非常相似
  • “较低”类型的平均值正在平均到较高类型
  • 平均类型为:2 小时、3 天、(4 周未使用)5 月和 6 年

  • 该错误仅出现在“每日 => 每月”步骤中。

询问:

  • 我们无法重现该错误,聚合作业的下一次运行通常可以正常工作。
  • 错误每 50-60 天发生一次,没有真正的模式
  • 环境:Oracle 10g

有人知道问题可能是什么吗?

INSERT INTO averages
SELECT averages_seq.NEXTVAL,
       avg.*
FROM (
  SELECT
      m.city_id,            m.city_name,
      m.state_id,           m.state_name,
      m.district_id,        m.district_name,
      m.country_id,         m.country_name,
      m.currency_id,        m.currency_name,
      m.category_id,        m.category_name,
      5 average_type, -- average_type 5 ==> monthly average
      0 analysis_type,
      TRUNC(m.average_date, 'MM')  average_date,
      AVG(m.value) value,
      SUM(m.sum) sum,
      NULL uncertainty,
      NULL uncertainty_type,
      MIN(m.value_min) value_min,
      MAX(m.value_max) value_max,
      SUM(number_of_measurements) number_of_measurements,
      -- 6 * 24 => measurements per day
      -- (ADD_MONTHS(...)) => days per month 
      100 * SUM(number_of_measurements) / 
           (6 * 24 *
           (ADD_MONTHS(TRUNC(average_date, 'MM'), 1)  - TRUNC(average_date, 'MM'))) coverage_percent,
      SUM(customers) customers,
      NULL dummy_field,
      CURRENT_TIMESTAMP calculation_date,
      CURRENT_TIMESTAMP creation_date,
      'AGGREGATION' creation_user,
      CURRENT_TIMESTAMP modification_date,
      'AGGREGATION' modification_user,
      'n' constant_1,
      3   constant_2,
      -1 average_state
  FROM averages m
  WHERE   m.average_type = 3 -- average type 3 ==> daily average
  AND     m.average_date
      BETWEEN
        TO_TIMESTAMP('2011-06-01T00:00:00Z', 'YYYY-MM-DD"T"HH24:MI:SS"Z"')
        AND
        TO_TIMESTAMP('2011-06-30T23:59:59Z', 'YYYY-MM-DD"T"HH24:MI:SS"Z"')
  AND     m.analysis_type = 0
  GROUP BY
        m.city_id,            m.city_name,
        m.state_id,           m.state_name,
        m.district_id,        m.district_name,
        m.country_id,         m.country_name,
        m.currency_id,        m.currency_name,
        m.category_id,        m.category_name,
        TRUNC(m.average_date, 'MM')
  ) avg
4

2 回答 2

1

我会通过以下方式添加一个组:

(ADD_MONTHS(TRUNC(average_date, 'MM'), 1)  - TRUNC(average_date, 'MM'))

我知道如果不更改就无法更改TRUNC(m.average_date, 'MM'),但它似乎是唯一不在您的 GROUP BY 中的非聚合列。

此外,您可以删除内部 sql 之外的所有非聚合、常量列,并显式命名您要插入的列并同时选择这些常量:

例如。

INSERT INTO averages(city_id, city_name, ...average_type, analysis_type, ...)
SELECT averages_seq.NEXTVAL,
avg.city_id, avg.city_name, ...
5, 0, ...

...不能说这部分会解决这个问题,但它肯定会让他们免于被怀疑没有被聚合。

于 2011-08-04T18:33:10.477 回答
0

从比较来看,average_date 是带有时区(本地时区?)的时间戳,但 TRUNC 在日期上工作。我想知道如果出现一些奇怪的情况,即选定的日期从一个月“跳跃”到另一个(例如,它发生在一个时区的一月,而另一个时区的二月)。

在此基础上,还要考虑客户端是否有影响(例如,从与数据库设置不同时区的客户端运行时可能会出错)。

我会扩展 Gerrat 指定列名的建议,以便您可以分离出常量

INSERT INTO averages
  (average_type, analysis_type, uncertainty, uncertainty_type,
  dummy_field, calculation_date, creation_date, creation_user, 
  modification_date, modification_user, constant_1, constant_2,
   ....
SELECT averages_seq.NEXTVAL,
      5 average_type, -- average_type 5 ==> monthly average
      0 analysis_type,
      NULL uncertainty,
      NULL uncertainty_type,
      NULL dummy_field,
      CURRENT_TIMESTAMP calculation_date,
      CURRENT_TIMESTAMP creation_date,
      'AGGREGATION' creation_user,
      CURRENT_TIMESTAMP modification_date,
      'AGGREGATION' modification_user,
      'n' constant_1,
      3   constant_2,
      -1 average_state
       avg.*
FROM (
  SELECT ...
于 2011-08-05T00:44:25.730 回答