0

我有一个小问题。所以我使用 Levenshtein-score 来搜索两个不同表格中街道名称之间超过 85% 的比较。但是当我在 WHERE 语句中使用我的 Levenshtein-score 计算时,我得到的输出是这样的:

  • 一张表中的街道名称:BEAU SITE 1ÈRE AVENUE & BEAU SITE 2ÈME AVENUE
  • 另一表中的街道名称:BEAU SITE-1ÈRE AVENUE & BEAU SITE-2ÈRE AVENUE
  • 输出:连接所有,第一个与第一个和第二个,第二个与第一个和第二个。

所以我必须使用所有分数计算的最大分数,是这样的:

    DECLARE    
    L_SCORE NUMBER;    
    L_NEW_SCORE NUMBER;    
    L_BEST_MAP varchar2(255);
    CURSOR C_TO_FIND IS    
    SELECT TT_NAME, L_MUNI, R_MUNI    
    FROM Y_TT_NOT_LINKED_STREETS    ;    
    CURSOR C_TOMTOM_STREET (L_MUNI VARCHAR2) IS    
    SELECT STREET_NAME    
    FROM STREET_NAME SN
                JOIN STREET STR ON STR.STREET_ID = SN.STR_STREET_ID
                JOIN ADMINISTRATIVE_AREA_NAME AAN ON AAN.AAR_ADMIN_AREA_ID = STR.AAR_ADMIN_AREA_ID    
    WHERE AAN.ADMIN_AREA_NAME = L_MUNI
                 AND STR.STREET_ID NOT IN (SELECT ROMA_STREET_ID FROM Y_DS_STREETS_LINK);
BEGIN   
FOR S IN C_TO_FIND LOOP
              L_SCORE := 0;
              L_NEW_SCORE := 0;
    FOR R IN C_TOMTOM_STREET(S.L_MUNI) LOOP
                  L_SCORE := PCK$ADDRESSMATCH.GET_LEVENSHTEIN_SCORE(S.TT_NAME,R.STREET_NAME);
                  IF L_SCORE > L_NEW_SCORE  THEN
                     L_NEW_SCORE := L_SCORE ;
                     L_BEST_MAP := R.STREET_NAME ||CHR(9)||TO_CHAR(L_NEW_SCORE);
                  END IF;
    END LOOP;
    IF L_NEW_SCORE > 85 THEN
                 DBMS_OUTPUT.PUT_LINE(S.L_MUNI||CHR(9)||S.TT_NAME||chr(9)||L_BEST_MAP);
    END IF;
    L_NEW_SCORE := 0;   
END LOOP; 
END;

现在的问题是,如何在 WHERE 语句中使用输出,这样我就可以只链接最大的 Levenshtein-score 而不会出现上述问题?这样: SELECT ... FROM ... WHERE (前一个块代码的最大分数)

(或者以另一种方式,在整整一周执行 SQL 之后,我看不到解决方案)

谢谢!=)

4

0 回答 0