我正在尝试将带有 'áéíóú' 之类的字符的字符串标准化为 'aeiou' 以简化搜索。
在对这个问题的回答之后,我应该使用这个Normalizer
类来做这件事。
问题是该normalize
函数什么都不做。例如,该代码:
<?php echo 'Pérez, NFC: ' . normalizer_normalize('Pérez', Normalizer::NFC)
. ' NFD: ' .normalizer_normalize('Pérez', Normalizer::NFD)
. ' NFKC: ' .normalizer_normalize('Pérez', Normalizer::NFKC)
. ' NFKD: ' .normalizer_normalize('Pérez', Normalizer::NFKD)?>
<br/>
<?php echo 'aáàä, êëéè,'
. ' FORM_C: ' . normalizer_normalize('aáàä, êëéè', Normalizer::FORM_C )
. ' FORM_D: ' .normalizer_normalize('aáàä, êëéè', Normalizer::FORM_D)
. ' FORM_KC: ' .normalizer_normalize('aáàä, êëéè', Normalizer::FORM_KC)
. ' FORM_KD: ' .normalizer_normalize('aáàä, êëéè', Normalizer::FORM_KD)?>
显示:
Pérez, NFC: Pérez NFD: Pérez NFKC: Pérez NFKD: Pérez
aáàä, êëéè, FORM_C: aáàä, êëéè FORM_D: aáàä, êëéè FORM_KC: aáàä, êëéè FORM_KD: aáàä, êëéè
什么是正常化必须做的?
---已编辑---
这是陌生的。从网络浏览器复制和粘贴结果时,在编辑器和原始页面中我可以看到:
FORM_D: aáàä, êëéè
在stackoverflow问题页面中我可以看到(仅在代码示例模式下):
FORM_D: aáàä, êëéè