我需要帮助。
我有 PostgreSQL regexp_replace 模式,例如:
regexp_replace(lower(institution_title),'[[:cntrl:]]|[[[:digit:]]|[[:punct:]]|[[:blank:]]|[[:space:]|„|“|“|”"]','','g')
我需要这个 PHP 语言的替代方案
因为一半来自 postgress db,我还必须比较来自 php 的字符串。
我需要帮助。
我有 PostgreSQL regexp_replace 模式,例如:
regexp_replace(lower(institution_title),'[[:cntrl:]]|[[[:digit:]]|[[:punct:]]|[[:blank:]]|[[:space:]|„|“|“|”"]','','g')
我需要这个 PHP 语言的替代方案
因为一半来自 postgress db,我还必须比较来自 php 的字符串。
您可以使用与 PHP PCRE 正则表达式相同的 POSIX 字符类:
preg_replace('/[[:cntrl:][:digit:][:punct:][:blank:][:space:]„““”"]+/', '', strtolower($institution_title))
看演示
此外,PCRE 中还有Unicode 类别类。因此,您也可以尝试
preg_replace('/[\p{Cc}\d\p{P}\s„““”"]+/u', '', mb_strtolower($institution_title, 'UTF-8'))
其中\p{Cc}
代表控制字符、\d
数字、\p{P}
标点符号和\s
空格。
我/u
也在添加修饰符来处理 Unicode 字符串。
查看正则表达式演示
伙计们,但我遇到了另一个问题,我无法匹配字符串,如果有特定的符号,
这是我的 postgres sql 输出:
SQL:
select regexp_replace(lower(title),'[[:cntrl:]]|[[[:digit:]]|[[:punct:]]|[[:blank:]]|[[:space:]|„|“|“|”"]','','g')
from cls_institutions
输出:
"oxforduniversity"
"šiauliųuniversitetas"
"harwarduniversity"
"internationalbusinessschool"
"vilniuscollege"
"žemaitijoskolegija"
"worldhealthorganization"
但在 PHP 中,输出有点不同:我得到了机构数组:
$institutions[] = "'".preg_replace('/[[:cntrl:][:digit:][:punct:][:blank:][:space:]„““”"]+/', '', strtolower($data[0]))."'";
PHP 输出如下:
"oxforduniversity",
"Šiauliųuniversitetas",
"harwarduniversity",
"internationalbusinessschool",
"vilniuscollege",
"Žemaitijoskolegija",
"worldhealthorganization"
第一个字母不是小写的,不知何故......我错过了什么?