这是想法。对于列中的每个数字,添加一个标志以确定它是否是序列的开头(将是负数之后的任何内容)。对该值进行累积求和以获得“序列计数”。然后,获取该值的最大值。我将展示一列的代码:
唯一的问题是实现,它需要多个级别的相关子查询。首先是分配SequenceStart
:
select r.*, rprev.A as prevA, rprev.B as prevB, rprev.C as prevC, rprev.D as prevD,
(case when (rprev.A < 0 or rprev.A is NULL) then 1 else 0 end) as ASeqStart,
(case when (rprev.B < 0 or rprev.B is NULL) then 1 else 0 end) as BSeqStart,
(case when (rprev.C < 0 or rprev.C is NULL) then 1 else 0 end) as CSeqStart,
(case when (rprev.D < 0 or rprev.D is NULL) then 1 else 0 end) as DSeqStart
from (select r.*,
(select max(id)
from results r2
where r2.id < r.id
) previd
from results r
) r left outer join
results rprev
on r.previd = rprev.id;
现在,获得累积总和很棘手,因为您需要两次该值。不幸的是,MySQL 不允许视图中的子查询。尽管您可以在下面使用相同的查询,但让我假设将结果放入 table 中TempSeq
。然后执行以下操作为每个值分配一个序列。
select ts.*,
sum(tsprev.ASeqStart) as ASeqId,
sum(tsprev.BSeqStart) as BSeqId,
sum(tsprev.CSeqStart) as CSeqId,
sum(tsprev.DSeqStart) as DSeqId
from TempSeq ts join
TempSeq tsprev
on tsprev.id <= ts.id
group by ts.id;
再一次,让我假设结果存储在另一个临时表中,例如TempSeqId
,因为您必须多次聚合结果。以下是 A 的示例:
select coalesce(max(seqlen), 0)
from (select ASeqId, count(*) as seqlen
from TempSeqId
where a > 0
) t
上的条件a
似乎是多余的。但是有一个不一样的挑战——大多数序列将以最终的负数结束。对于这些,您可以从计数中减去一个。然而,最终的序列可能不会以这种方式结束,你会低估它。合并适用于所有值均为负数的情况。
id
在这一点上,让我说,如果数据结构存储在一行中,并且一行上有一个值,那么查询实际上是可行的(即使是单个查询)sequencename
。
编辑:
上面的推理是我对这个问题的看法。在 MySQL 中,您可以使用变量以不同的方式处理此问题。代码要简单得多:
select MAX(APosCounter) as AMaxLen,
MAX(BPosCounter) as BMaxLen,
MAX(CPosCounter) as CMaxLen,
MAX(DPosCounter) as DMaxLen
from (select r.*,
@APosCounter := if(A > 0, @APosCounter + 1, 0) as APosCounter,
@BPosCounter := if(B > 0, @BPosCounter + 1, 0) as BPosCounter,
@CPosCounter := if(C > 0, @CPosCounter + 1, 0) as CPosCounter,
@DPosCounter := if(D > 0, @DPosCounter + 1, 0) as DPosCounter
from results r cross join
(select @APosCounter := 0, @AMaxLen := 0,
@BPosCounter := 0, @BMaxLen := 0,
@CPosCounter := 0, @CMaxLen := 0,
@DPosCounter := 0, @DMaxLen := 0
end) const
order by id
) r
此代码使用可变逻辑来保持每一行的“正序列长度”的长度。然后它聚合数据以获得最大值。
这里甚至有一个 SQLFiddle 来证明它是有效的。