2

我们使用的是 TD 14 版本,我来自 Netezza / Postgre(Redshift) 背景。我被要求从审计日志中提取登录数据,以找出相同 ip 提交外观相似的用户名并进行小的更改的记录/交易。例如 Samir --> Samr --> Amir 等 捕获网络钓鱼活动。在 POstgres 中,我们有像 '%' 这样的模糊字符串函数,例如 ColA % ColB(其中 % 运算符等同于 Similar)Soundex、Metaphone、levenshtein 等。但是在 Teradata 中,我刚刚遇到或者我只能找到 Soundex。Teradata 版本 14 是否有任何此类内置函数/方法功能来实现上述字符串近似。

4

1 回答 1

0

Teradata 14.x 通过函数支持 Damerau-Levenshtein 距离算法,EDITDISTANCE()并通过函数支持 n-gram 模式匹配NGRAM()

您可以在此处找到有关 EDITDISTANCE 函数和 NGRAM() 函数的信息

于 2016-07-07T01:41:58.913 回答