database - 名称标准化 - 删除变音符号

Question

我继承了一个带有 item_names 表的数据库。

item_names 中的文本具有非标准文本，因此名称的一个版本是使用 getStandardizedName PL/SQL 函数创建的。该版本用于搜索目的（针对最终用户输入的搜索调用相同的函数）。

在这个函数中有很多东西，比如下面的代码。我的问题是，没有更好的方法来做到这一点吗？每百万个项目大约需要 90 分钟。不幸的是，目前的工作流程要求每周进行 5 到 6 次。

请注意，以下类型的'REPLACE'有80多个

   l_name := REPLACE(l_name, 'STE-', ' SAINT ');
   l_name := REPLACE(l_name, 'ST-', ' SAINT ');

   l_name := replace(l_name, '+','');
   l_name := replace(l_name, '-','');

   l_name := replace(l_name, '=','');
   l_name := replace(l_name, '_','');
   l_name := replace(l_name, '.','');

score 0 · Accepted Answer

如果您可以识别常见的模式/分组，您应该能够用几个regexp_replace调用来替换它们。您已经在评论中确定了标点符号示例。

l_name := regexp_replace(l_name, '([[:punct:]])', ' ')

SAINT 对可以替换为：

l_name := regexp_replace(l_name, 'ST[E]{0,1}-', 'SAINT ')

database - 名称标准化 - 删除变音符号

1 回答 1

Related

Reference