这是我的表结构:
+-------+--------+----------+
| item | price | quantity |
+-------+--------+----------+
| 22452 | 579150 | 4 |
| 34664 | 334425 | 7 |
| 32249 | 204750 | 3 |
| 39970 | 97500 | 5 |
| 36907 | 116415 | 6 |
| 4338 | 207451 | 17 |
| 23425 | 388050 | 4 |
| 23427 | 532350 | 14 |
| 76080 | 180000 | 6 |
| 76076 | 400000 | 4 |
+-------+--------+----------+
项目不是唯一的,每个项目可能有 1 到几千行不等,因此我按项目对结果进行分组。我当前的查询如下:
SELECT item AS id,
COUNT(item) as total,
ROUND(AVG(price/quantity)) AS mean,
ROUND(MIN(price/quantity)) AS cheapest
FROM `data`
GROUP BY item;
除了这 4 个结果之外,我还想计算值的底部 15% 行的平均价格(price/quantity)
(不是 < 0.15*MAX(price/quantity) 而是 0.15*total,按 (price/quantity) ASC 排序) . 我想到的解决方案涉及使用该项目的计数作为限制器的临时表,但如果可能的话,我非常希望它是单个查询。我确定我在这里需要一个子查询,但我不确定如何获取该特定项目的计数,然后限制该结果的 15%。
使用下面的答案进行更新
使用下面的@GordonLinoff 答案让我基本上一路走来。但是,我确实遇到了两个问题。最大的一个是 @rn 变量没有重置,这导致它保持递增,随后只有第一行项目被包含在内。第二个是在表中出现次数的 15% < 1 的任何项目,返回 NULL。更正是次要的,我在下面包含了我使用的最终查询:
SELECT item AS id,
COUNT(item) as total,
ROUND(AVG(price/quantity)) AS mean,
ROUND(MIN(price/quantity)) AS cheapest,
ROUND(avg(case when rn <= IF(cnt * 0.15 < 1, cnt, cnt * 0.15) then price/quantity end)) as Cheapest15Percent
FROM
(SELECT d.*, cnt, IF(@item = d.item, @rn := @rn + 1, if(@item := d.item, @rn := 1, 1)) as rn
FROM `data` d LEFT JOIN
(SELECT item, COUNT(*) cnt FROM `udata` GROUP BY item) di
ON d.item = di.item CROSS JOIN
(SELECT @rn := 0, @item := -1) vars
ORDER BY d.item, d.price/d.quantity) d
GROUP BY d.item;