3

我有一些项目,我index.php用各种GET参数重定向每个请求。

目前,我正在使用这种 htaccess (这只是一个摘录,我将参数名称更改为a, b, c...,以简化问题):

RewriteRule ^([\w-]+)\.html$                   index.php?a=$1 [L]
RewriteRule ^([\w-]+)/([\w-]+)\.html$          index.php?a=$1&b=$2 [L]
RewriteRule ^([\w-]+)/([\w-]+)/([\w-]+)\.html$ index.php?a=$1&b=$2&c=$3 [L]
(...)

它工作(很好),但我正在考虑一种将这些行缩小为单个行的方法。 这个想法是有一些嵌套括号来“生成”所有GET参数,但它似乎不像我想象的那么容易。

这是我到目前为止所做的:

RewriteRule 
    ^(?:([\w-]+)\/)*([\w-]+)\.html$ 
    index.php?a=$1&b=$2&c=$3&d=$4&e=$5&f=$6&g=$7&h=$8&i=$9 [L]

GET网址的结果http://website.com/1/2/3/4/5/6/7/8/9.html

array(9) { 
   ["a"]=> string(1) "8" 
   ["b"]=> string(1) "9" 
   ["c"]=> string(0) "" 
   ["d"]=> string(0) "" 
   ["e"]=> string(0) "" 
   ["f"]=> string(0) "" 
   ["g"]=> string(0) "" 
   ["h"]=> string(0) "" 
   ["i"]=> string(0) "" 
}

而不是 get a=1, b=2, c=3... 我只收到最后两个参数。请注意,RewriteRule执行,然后我知道我的正则表达式匹配。

任何的想法 ?

4

2 回答 2

3

作为记录:请考虑使用基于 PHP 的方法:将整个请求的 URI 传递给 PHP,然后您可以在 PHP 中处理整个事情,这比做这件事要容易得多,很可能更安全,甚至可能更快mod_rewrite 的魔力。

我的意思是这样的:

 RewriteRule ^(.*)\.html$ switchboard.php?uri=$1 [L]

然后在switchboard.php中:

list($_GET['a'], $_GET['b'], $_GET['c']) = explode( '/', $_GET['uri']);
require 'index.php';

(如果超长的 list() 看起来很麻烦,你可以使用一些巧妙的单线映射技术)

无论如何,正则表达式问题当然很有趣,但它是一个通用的 PCRE 问题。这种现象称为“重复捕获组”:每当您像您一样使用 Kleene 星重复捕获组时,实际上只会捕获最后一次迭代(在我们的例子中,匹配 1,2..7 被丢弃,并且只保留了 8 个) - 将其想象为一个缓冲区,您不断地用更新的匹配项覆盖它。如果您考虑一下,这很有意义。

一个解决方案是使用你实际想要捕获的尽可能多的组,通过使早期的组成为可选 - 编写和阅读非常尴尬(实际上,Arjan 刚刚发布了它,只是看着它就让人头疼),而且在这种情况下非常低效。一个更简单的解决方案是捕获整个事物并将其拆分。

于 2012-08-24T14:20:46.843 回答
1
RewriteRule 
    ^([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+)(?:\/([\w-]+))?)?)?)?)?)?)?)?\.html$ 
    index.php?a=$1&b=$2&c=$3&d=$4&e=$5&f=$6&g=$7&h=$8&i=$9 [L]

Untested, but I think this does what you want. Note that it works for 1 to 9 parameters, it requires at least one. Also note that any GET parameter that was present in the original url could be removed this way.

于 2012-08-24T14:21:08.963 回答