1

我继承了一个带有 item_names 表的数据库。

item_names 中的文本具有非标准文本,因此名称的一个版本是使用 getStandardizedName PL/SQL 函数创建的。该版本用于搜索目的(针对最终用户输入的搜索调用相同的函数)。

在这个函数中有很多东西,比如下面的代码。我的问题是,没有更好的方法来做到这一点吗?每百万个项目大约需要 90 分钟。不幸的是,目前的工作流程要求每周进行 5 到 6 次。

请注意,以下类型的'REPLACE'有80多个

   l_name := REPLACE(l_name, 'STE-', ' SAINT ');
   l_name := REPLACE(l_name, 'ST-', ' SAINT ');

   l_name := replace(l_name, '+','');
   l_name := replace(l_name, '-','');

   l_name := replace(l_name, '=','');
   l_name := replace(l_name, '_','');
   l_name := replace(l_name, '.','');
4

1 回答 1

0

如果您可以识别常见的模式/分组,您应该能够用几个regexp_replace调用来替换它们。您已经在评论中确定了标点符号示例。

l_name := regexp_replace(l_name, '([[:punct:]])', ' ')

SAINT 对可以替换为:

l_name := regexp_replace(l_name, 'ST[E]{0,1}-', 'SAINT ')
于 2012-08-21T21:45:27.197 回答