仅使用正则表达式模式是不可能的。这不是因为你不能告诉正则表达式引擎匹配所有的“e”和类似的东西。但是,可以首先对输入数据(数组和搜索输入)进行规范化,然后搜索规范化数据,但返回非规范化数据的结果。
在下面的示例中,我使用音译来进行这种规范化,我想这就是您要寻找的:
$data = ['Napoléon', 'Café'];
$result = array_translit_search('le', $data);
print_r($result);
$result = array_translit_search('leó', $data);
print_r($result);
示例性输出是:
Array
(
[0] => Napoléon
)
Array
(
[0] => Napoléon
)
如上所述,搜索函数本身相当简单,转写输入,执行preg_grep
然后返回原始输入匹配:
/**
* @param string $search
* @param array $data
* @return array
*/
function array_translit_search($search, array $data) {
$transliterator = Transliterator::create('ASCII-Latin', Transliterator::REVERSE);
$normalize = function ($string) use ($transliterator) {
return $transliterator->transliterate($string);
};
$dataTrans = array_map($normalize, $data);
$searchTrans = $normalize($search);
$pattern = sprintf('/%s/i', preg_quote($searchTrans));
$result = preg_grep($pattern, $dataTrans);
return array_intersect_key($data, $result);
}
此代码需要Transliterator
来自 Intl 扩展名,您可以将其替换为任何其他类似的音译或翻译功能。
顺便说一句,我不建议在str_replace
这里使用。如果您需要回退到翻译表,请strtr
改用。这就是你要找的。但我更喜欢一个自带翻译的库,特别是如果它是 Intl 库,你通常无法击败它。