1

我有一个用于跟踪索赔付款的数据库。有一个索赔claim表、一个每月付款claim_month表和一个定义每个月的表monthmonth按顺序排列每个条目,以便如果month_id[1] > month_id[2]第二个数字早于第一个数字。

使用查询(paid_to_date出于隐私目的添加随机化):

SELECT
claim.claim_id,
m.month_id,
claim_month_id,
IF (claim_month.paid_to_date IS NOT NULL, ROUND(RAND(1) * 100), NULL) AS paid_to_date
FROM
    claim
    INNER JOIN ( SELECT DISTINCT month_id FROM claim_month ) AS m
    LEFT JOIN claim_month ON claim.claim_id = claim_month.claim_id 
    AND m.month_id = claim_month.month_id

我得到以下数据。

INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (25, 1004, 8584, 41);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (25, 1005, NULL, NULL);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (25, 1006, NULL, NULL);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (25, 1007, NULL, NULL);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (21, 1004, 8580, 87);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (21, 1005, NULL, NULL);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (21, 1006, NULL, NULL);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (21, 1007, NULL, NULL);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (5, 1004, 8564, 14);
INSERT INTO ``(`claim_id`, `month_id`, `claim_month_id`, `paid_to_date`) VALUES (5, 1005, 8627, 9);

数据可视化

从这里开始,我需要将 NULL 替换为每个claim_id.

  • 由于我使用的是 MariaDB/MYSQL,因此 LAG 函数不允许忽略 NULL,这很不幸,因为它看起来很完美。

  • 我也研究过使用 COALESCE 并对其进行分区,但这似乎也不允许。

  • 我也研究过使用用户定义的函数,但是我正在使用多种数据类型,并且似乎无法确定如何定义不需要设置输出数据类型的函数。

我整个上午都在查看以前的问题,但是其中大多数是针对 PostgresSQL 的,这在这种情况下并不是特别有用。我错过了什么?

4

1 回答 1

0

我已经制定了一个解决方案,但我不相信它是最好的。我怀疑对于较大的数据库,这将是相当苛刻的。然而,它同时工作。

我基本上已经将表格重复地加入到自身上,无论记录是较早的还是使用类似于以下内容的相同声明:

SELECT 
    b.claim_id,
    b.month_id,
    b.claim_month_id,
    claim_month.claim_month_id AS claim_month_id_latest

FROM

(SELECT
    a.claim_id,
    a.month_id,
    a.claim_month_id,
    MAX(claim_month.month_id) AS source_month_id

FROM
    (
    SELECT
        claim.claim_id,
        m.month_id,
        claim_month_id
    FROM
        claim
        INNER JOIN ( SELECT DISTINCT month_id FROM claim_month ) AS m
        LEFT JOIN claim_month ON claim.claim_id = claim_month.claim_id 
        AND m.month_id = claim_month.month_id 

    ) AS a
    LEFT JOIN claim_month ON a.claim_id = claim_month.claim_id 
                                                AND a.month_id >= claim_month.month_id

GROUP BY
    a.claim_id, a.month_id) AS b
    LEFT JOIN claim_month ON b.claim_id = claim_month.claim_id AND b.source_month_id = claim_month.month_id


ORDER BY b.claim_id, b.month_id 
于 2018-10-18T05:29:50.780 回答