0

我需要将所有西里尔字符替换为“[]”括号之间的拉丁等价字符。这是示例:

Приметимо да
формула (\ref{ј5121}) обухвата
и случајеве а) и б).
Заиста, из (\ref{ј5121}), за $x_1=x_2$
добија се:
\[
|АБ|=\sqrt{(y_2-у_1)^2}=|y_2-п_1|,
\]
а из (\ref{ј5121}), за $y_1=y_2$:
\[
|AЦ|=\sqrt{(м_2-х_1)^2}=|н_2-x_1|.
\]

Стога се формула (\ref{ј5121}) може
применити на било које
двe тачке, без обзира
на њихов положај.

我已经设法使用以下代码隔离括号之间的内容: $pattern = "/[([^)]*)]/"; preg_match_all($pattern, $string, $output);

但我不能让它用拉丁字符替换西里尔字符:\ 欢迎任何形式的帮助。谢谢!

4

1 回答 1

2

你可以使用这个:

$data = <<<'LOD'
Приметимо да
формула (\ref{ј5121}) обухвата
и случајеве а) и б).
Заиста, из (\ref{ј5121}), за $x_1=x_2$
добија се:
\[
|АБ|=\sqrt{(y_2-у_1)^2}=|y_2-п_1|,
\]
а из (\ref{ј5121}), за $y_1=y_2$:
\[
|AЦ|=\sqrt{(м_2-х_1)^2}=|н_2-x_1|.
\]
LOD;

$pattern = '~(?<=\[)[^]]++(?=])~u';

$result = preg_replace_callback($pattern, function ($m) {
    $cyrillic2latin = array(
        'A'=>'A', 'Б'=>'B', 'В'=>'V', 'Г'=>'G', 'Д'=>'D', 'Е'=>'E',
        'Ё'=>'YO', 'Ж'=>'ZH', 'З'=>'Z', 'И'=>'I', 'Й'=>'J', 'К'=>'K',
        'Л'=>'L', 'М'=>'M', 'Н'=>'N', 'О'=>'O', 'П'=>'P', 'Р'=>'R',
        'С'=>'S', 'Т'=>'T', 'У'=>'U', 'Ф'=>'F', 'Х'=>'H', 'Ц'=>'TS',
        'Ч'=>'CH', 'Ш'=>'SH', 'Щ'=>'SHCH', 'Ъ'=>'\'', 'Э'=>'E', 'Ю'=>'YU',
        'Я'=>'YA');
    return strtr($m[0], $cyrillic2latin);
}, $data);
print_r($result);

随时更正它并添加小写字母!

如果您使用 PHP >= 5.4.0,您可以将函数更改为:

$result = preg_replace_callback($pattern, function ($m) {
    return transliterator_transliterate("Cyrillic-Latin", $m[0]);
}, $data);
于 2014-01-16T01:22:21.510 回答