2

我正在 Oracle Fusion Financials 中创建一个数据模型,以将各方匹配在一起,从供应商使用到客户使用。这些当事人有一个以他们的名义注册的代码。在 Google 上搜索表名将找到架构(例如HZ_PARTIES),尽管查看架构来解决此问题并不是非常必要。

我们的数据质量并不是我们想要的。为确保我不会丢失记录,我需要加入名称中也包含代码的其他方。

这是我到目前为止所拥有的,它给出了结果。

SELECT
 RCTA.TRX_NUMBER
,RCTA.CT_REFERENCE 
,HP.PARTY_NAME  PARTY_NAME1
,HP2.PARTY_NAME PARTY_NAME2
,IEBC.IBAN CUSTOMER_IBAN

FROM
 HZ_PARTIES HP,
 HZ_PARTIES HP2,
 IBY_ACCOUNT_OWNERS IAO,
 IBY_EXT_BANK_ACCOUNTS IEBC,
 RA_CUSTOMER_TRX_ALL RCTA,
 HZ_CUST_ACCOUNTS HCA 

WHERE 1=1
  AND RCTA.BILL_TO_CUSTOMER_ID = HCA.CUST_ACCOUNT_ID (+)
  AND HCA.PARTY_ID = HP.PARTY_ID(+)
  AND REGEXP_SUBSTR(HP.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') in REGEXP_SUBSTR(HP2.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') -- Join on code found in party name.  
  AND IAO.ACCOUNT_OWNER_PARTY_ID (+) IN (HP2.PARTY_ID)
  AND IAO.EXT_BANK_ACCOUNT_ID = IEBC.EXT_BANK_ACCOUNT_ID (+)

但是,这会执行内部联接而不是我需要的外部联接。

我尝试了以下方法,它给出了语法错误(缺少括号):

AND REGEXP_SUBSTR(HP.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') = REGEXP_SUBSTR(HP2.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') (+)

也试过这个,这使得查询运行时间过长。没有等待结果,因为它可能不正确:

AND ( REGEXP_SUBSTR(HP.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') = REGEXP_SUBSTR(HP2.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') (+) -- Join on investor code found in party name.  
   OR NOT REGEXP_LIKE(HP.PARTY_NAME,'([0-9]{2}[A-Z]{2}[0-9]{3})') -- Escape to outer join in case there's no investor code in name
  )

如果有必要完成这项工作,我愿意将 (+) 连接重写为常规外连接语法。

4

2 回答 2

1

您将外连接运算符放在(+)错误的位置。应该是这样的:

SQL> with
  2  hp (party_name) as
  3    (select '11AA111' from dual union all
  4     select '22BB222' from dual
  5    ),
  6  hp2 (party_name) as
  7    (select '11AA111' from dual union all
  8     select '33CC333' from dual
  9    )
 10  select hp.*
 11  from hp, hp2
 12  where regexp_substr(hp.party_name     , '([0-9]{2}[A-Z]{2}[0-9]{3})') =
 13        regexp_substr(hp2.party_name (+), '([0-9]{2}[A-Z]{2}[0-9]{3})')
 14  /                                  ---
                                        here
PARTY_N
-------
11AA111
22BB222

SQL>

至于正确的连接......好吧,是的 - 如果你愿意,你可以重写它,但我认为在这种情况下它不会有帮助。如果查询按原样运行正常,我会保持原样并在必要时重写它。

于 2020-03-20T09:25:07.977 回答
0

hz_parties如果允许的话,我建议您向表中添加一个虚拟列并为其编制索引:

alter table hz_parties add code varchar2(7) as regexp_substr(party_name, '([0-9]{2}[A-Z]{2}[0-9]{3})');
create index idx_parties_code on hz_parties (code);

如果不允许您更改表,请改用函数索引:

create index idx_parties_code on hz_parties (regexp_substr(party_name, '([0-9]{2}[A-Z]{2}[0-9]{3})'));

如果不允许在现有表上添加索引,则使用索引创建一个新表,例如:

create table party_code
(
  party_id  number(10)   not null,
  code      varchar2(7)  not null,
  primary key (party_id)
);

insert into party_code (party_id, code)
select party_id, regexp_substr(party_name, '([0-9]{2}[A-Z]{2}[0-9]{3})')
from hz_parties;

create index idx_party_code on party_code (code, party_id);

在任何这些情况下,您都预先提取了代码,并且连接应该很快。

为了找到重复项,只需按代码分组。例如:

select code, listagg(party_id, ', ') within group (order by party_id)
from party_code
group by code
having count(*) > 1;

重新编写查询以使用显式连接以使其可读,修复错误的外部连接并发现可能的其他错误。

于 2020-03-20T10:33:24.800 回答