python - Redshift 中的 Python UDF 函数始终返回 NULL 值

Question

我想在 Redshift 中有一个功能可以消除单词中的重音符号。我在 SO( question ) 中找到了一个问题，其中包含用于制作它的 Python 代码。我尝试了一些解决方案，其中之一是：

import unicodedata
def remove_accents(accented_string):
    nfkd_form = unicodedata.normalize('NFKD', input_str)
    return u"".join([c for c in nfkd_form if not unicodedata.combining(c)])

然后我在 Redshift 中创建函数如下：

create function remove_accents(accented_string varchar)
returns varchar
immutable
as $$
import unicodedata
def remove_accents(accented_string):
    nfkd_form = unicodedata.normalize('NFKD', input_str)
    return u"".join([c for c in nfkd_form if not unicodedata.combining(c)])
$$ language plpythonu;

我将它应用到一个列：

SELECT remove_accents(city) FROM info_geo

只获取空值。列 city 是 varchar 类型。为什么我得到空值，我该如何解决？

score 1 · Accepted Answer

您无需在 UDF 中创建 Python 函数。添加对函数的调用或将其编写为标量表达式：

create function remove_accents(accented_string varchar)
returns varchar
immutable
as $$
  import unicodedata
  nfkd_form = unicodedata.normalize('NFKD', accented_string)
  return u"".join([c for c in nfkd_form if not unicodedata.combining(c)])
$$ language plpythonu;

python - Redshift 中的 Python UDF 函数始终返回 NULL 值

1 回答 1

Related

Reference