我有一个小问题。所以我使用 Levenshtein-score 来搜索两个不同表格中街道名称之间超过 85% 的比较。但是当我在 WHERE 语句中使用我的 Levenshtein-score 计算时,我得到的输出是这样的:
- 一张表中的街道名称:BEAU SITE 1ÈRE AVENUE & BEAU SITE 2ÈME AVENUE
- 另一表中的街道名称:BEAU SITE-1ÈRE AVENUE & BEAU SITE-2ÈRE AVENUE
- 输出:连接所有,第一个与第一个和第二个,第二个与第一个和第二个。
所以我必须使用所有分数计算的最大分数,是这样的:
DECLARE
L_SCORE NUMBER;
L_NEW_SCORE NUMBER;
L_BEST_MAP varchar2(255);
CURSOR C_TO_FIND IS
SELECT TT_NAME, L_MUNI, R_MUNI
FROM Y_TT_NOT_LINKED_STREETS ;
CURSOR C_TOMTOM_STREET (L_MUNI VARCHAR2) IS
SELECT STREET_NAME
FROM STREET_NAME SN
JOIN STREET STR ON STR.STREET_ID = SN.STR_STREET_ID
JOIN ADMINISTRATIVE_AREA_NAME AAN ON AAN.AAR_ADMIN_AREA_ID = STR.AAR_ADMIN_AREA_ID
WHERE AAN.ADMIN_AREA_NAME = L_MUNI
AND STR.STREET_ID NOT IN (SELECT ROMA_STREET_ID FROM Y_DS_STREETS_LINK);
BEGIN
FOR S IN C_TO_FIND LOOP
L_SCORE := 0;
L_NEW_SCORE := 0;
FOR R IN C_TOMTOM_STREET(S.L_MUNI) LOOP
L_SCORE := PCK$ADDRESSMATCH.GET_LEVENSHTEIN_SCORE(S.TT_NAME,R.STREET_NAME);
IF L_SCORE > L_NEW_SCORE THEN
L_NEW_SCORE := L_SCORE ;
L_BEST_MAP := R.STREET_NAME ||CHR(9)||TO_CHAR(L_NEW_SCORE);
END IF;
END LOOP;
IF L_NEW_SCORE > 85 THEN
DBMS_OUTPUT.PUT_LINE(S.L_MUNI||CHR(9)||S.TT_NAME||chr(9)||L_BEST_MAP);
END IF;
L_NEW_SCORE := 0;
END LOOP;
END;
现在的问题是,如何在 WHERE 语句中使用输出,这样我就可以只链接最大的 Levenshtein-score 而不会出现上述问题?这样: SELECT ... FROM ... WHERE (前一个块代码的最大分数)
(或者以另一种方式,在整整一周执行 SQL 之后,我看不到解决方案)
谢谢!=)