3

我有以下 LaTeX 命令:

\autocites[][]{}[][]{}

里面的参数[]是可选的,里面的其他参数{}是强制性的。该\autocites命令可以通过其他参数组进行扩展,例如:

\autocites[a1][a2]{a3}[b1][b2]{b3}
\autocites[a1][a2]{a3}[b1][b2]{b3}[c1][c2]{c3}
...

它也可以这样使用:

\autocites{a}{b}
\autocites{a}[b1][]{b3}
\autocites{a}[][b2]{b3}
...

我想通过在 PHP 中使用正则表达式来提取它的参数。这是我的第一次尝试:

/\\autocites(\[(.*?)\])(\[(.*?)\])(\{(.*?)\})(\[(.*?)\])(\[(.*?)\])(\{(.*?)\})/

虽然如果\autocites只包含两组三个参数,这可以正常工作,但我无法弄清楚如何让它适用于未知数量的参数。

我还尝试使用以下表达式:

/\\autocites((\[(.*?)\]\[(.*?)\])?\{(.*?)\}){2,}/

这次我可以匹配更多的参数,但是我无法提取所有值,因为 PHP 总是只给我最后三个参数的内容:

Array
(
    [0] => Array
        (
            [0] => \autocites[a][b]{c}[d][e]{f}[a][a]{a}
        )

    [1] => Array
        (
            [0] => [a][a]{a}
        )

    [2] => Array
        (
            [0] => [a][a]
        )

    [3] => Array
        (
            [0] => a
        )

    [4] => Array
        (
            [0] => a
        )

    [5] => Array
        (
            [0] => a
        )

)

任何帮助是极大的赞赏。

4

1 回答 1

2

您必须分两步执行此操作。只有 .NET 可以检索任意数量的捕获。在所有其他风格中,生成的捕获量由模式中的组数固定(重复一个组只会覆盖以前的捕获)。

所以首先,匹配整个事物以获取参数,然后在第二步中提取它们:

preg_match('/\\\\autocites((?:\{[^}]*\}|\[[^]]*\])+)/', $input, $autocite);
preg_match_all('/(?|\{([^}]*)\}|\[([^]]*)\])/', $autocite[1], $parameters);
// $parameters[1] will now be an array of all parameters

工作 演示。

使用稍微复杂一点的方法和锚\G,我们也可以一次性完成所有操作,通过使用任意数量的匹配而不是捕获:

preg_match_all('/
    (?|             # two alternatives whose group numbers both begin at 1
      \\\\autocites  # match the command
      (?|\{([^}]*)\}|\[([^]]*)\])
                    # and a parameter in group 1
    |               # OR
      \G            # anchor the match to the end of the last match
      (?|\{([^}]*)\}|\[([^]]*)\])
                    # and match a parameter in group 1
    )
    /x',
    $input,
    $parameters);
// again, you'll have an array of parameters in $parameters[1]

工作演示。

请注意,使用这种方法 - 如果您autocites的代码中有多个,您将从单个列表中的所有命令中获取所有参数。有一些方法可以缓解这种情况,但我认为在这种情况下第一种方法会更干净。

如果您希望能够区分可选参数和强制参数(使用任何方法),请捕获开始或结束括号/大括号以及参数,并检查该字符以找出它是哪种类型。

于 2013-08-04T20:34:32.137 回答