1

我想在 Redshift 中有一个功能可以消除单词中的重音符号。我在 SO( question ) 中找到了一个问题,其中包含用于制作它的 Python 代码。我尝试了一些解决方案,其中之一是:

import unicodedata
def remove_accents(accented_string):
    nfkd_form = unicodedata.normalize('NFKD', input_str)
    return u"".join([c for c in nfkd_form if not unicodedata.combining(c)])

然后我在 Redshift 中创建函数如下:

create function remove_accents(accented_string varchar)
returns varchar
immutable
as $$
import unicodedata
def remove_accents(accented_string):
    nfkd_form = unicodedata.normalize('NFKD', input_str)
    return u"".join([c for c in nfkd_form if not unicodedata.combining(c)])
$$ language plpythonu;

我将它应用到一个列:

SELECT remove_accents(city) FROM info_geo

只获取空值。列 city 是 varchar 类型。为什么我得到空值,我该如何解决?

4

1 回答 1

1

您无需在 UDF 中创建 Python 函数。添加对函数的调用或将其编写为标量表达式:

create function remove_accents(accented_string varchar)
returns varchar
immutable
as $$
  import unicodedata
  nfkd_form = unicodedata.normalize('NFKD', accented_string)
  return u"".join([c for c in nfkd_form if not unicodedata.combining(c)])
$$ language plpythonu;
于 2020-01-17T08:34:46.460 回答