1

我有一个名为“结果”的表,如下所示:

ID -A- -B- -C- -D- -E- -F-
 1 100 -76 34 -45 54 65
 2 34 -43 57 -12 13 -21
 3 104 -76 34 -45 -3 43
 4 100 -76 -4 -45 54 65
 5 34 -43 57 -12 13 -21
 6 104 -76 34 -45 -3 43

显然有更多的数据,但我认为这足以得到这个想法。

我想要得到的是每列中连续正数的最大计数。

什么是 mysql 查询呢?

谢谢您阅读此篇。

4

2 回答 2

1

这是想法。对于列中的每个数字,添加一个标志以确定它是否是序列的开头(将是负数之后的任何内容)。对该值进行累积求和以获得“序列计数”。然后,获取该值的最大值。我将展示一列的代码:

唯一的问题是实现,它需要多个级别的相关子查询。首先是分配SequenceStart

select r.*, rprev.A as prevA, rprev.B as prevB, rprev.C as prevC, rprev.D as prevD,
       (case when (rprev.A < 0 or rprev.A is NULL) then 1 else 0 end) as ASeqStart,
       (case when (rprev.B < 0 or rprev.B is NULL) then 1 else 0 end) as BSeqStart,
       (case when (rprev.C < 0 or rprev.C is NULL) then 1 else 0 end) as CSeqStart,
       (case when (rprev.D < 0 or rprev.D is NULL) then 1 else 0 end) as DSeqStart
from (select r.*,
             (select max(id)
              from results r2
              where r2.id < r.id
             )  previd
      from results r
     ) r left outer join
     results rprev
     on r.previd = rprev.id;

现在,获得累积总和很棘手,因为您需要两次该值。不幸的是,MySQL 不允许视图中的子查询。尽管您可以在下面使用相同的查询,但让我假设将结果放入 table 中TempSeq。然后执行以下操作为每个值分配一个序列。

select ts.*,
       sum(tsprev.ASeqStart) as ASeqId,
       sum(tsprev.BSeqStart) as BSeqId,
       sum(tsprev.CSeqStart) as CSeqId,
       sum(tsprev.DSeqStart) as DSeqId
from TempSeq ts join
     TempSeq tsprev
     on tsprev.id <= ts.id
group by ts.id;

再一次,让我假设结果存储在另一个临时表中,例如TempSeqId,因为您必须多次聚合结果。以下是 A 的示例:

select coalesce(max(seqlen), 0)
from (select ASeqId, count(*) as seqlen
      from TempSeqId
      where a > 0
     ) t

上的条件a似乎是多余的。但是有一个不一样的挑战——大多数序列将以最终的负数结束。对于这些,您可以从计数中减去一个。然而,最终的序列可能不会以这种方式结束,你会低估它。合并适用于所有值均为负数的情况。

id在这一点上,让我说,如果数据结构存储在一行中,并且一行上有一个值,那么查询实际上是可行的(即使是单个查询)sequencename

编辑:

上面的推理是我对这个问题的看法。在 MySQL 中,您可以使用变量以不同的方式处理此问题。代码要简单得多:

select MAX(APosCounter) as AMaxLen,
       MAX(BPosCounter) as BMaxLen,
       MAX(CPosCounter) as CMaxLen,
       MAX(DPosCounter) as DMaxLen
from (select r.*,
             @APosCounter := if(A > 0, @APosCounter + 1, 0) as APosCounter,
             @BPosCounter := if(B > 0, @BPosCounter + 1, 0) as BPosCounter,
             @CPosCounter := if(C > 0, @CPosCounter + 1, 0) as CPosCounter,
             @DPosCounter := if(D > 0, @DPosCounter + 1, 0) as DPosCounter
      from results r cross join
           (select @APosCounter := 0, @AMaxLen := 0,
                   @BPosCounter := 0, @BMaxLen := 0,
                   @CPosCounter := 0, @CMaxLen := 0,
                   @DPosCounter := 0, @DMaxLen := 0
            end) const
      order by id
     ) r

此代码使用可变逻辑来保持每一行的“正序列长度”的长度。然后它聚合数据以获得最大值。

这里甚至有一个 SQLFiddle 来证明它是有效的。

于 2013-07-19T10:53:32.793 回答
0
select  GREATEST(
sum(if (A <= 0, 0,1)),
sum(if (B <= 0, 0,1)),
sum(if (C <= 0, 0,1)),
sum(if (D <= 0, 0,1)),
sum(if (E <= 0, 0,1)),
sum(if( F <= 0, 0,1)) 
) FROM RESULT
于 2013-07-19T10:24:19.693 回答