1

我是第一次使用 Nginx,但对它基本上一无所知。

我需要将 100+ URL 中的“_”替换为“-”。我想一定有一种简单的方法可以用 Nginx 做到这一点,但在谷歌上找不到任何东西。

谢谢!

编辑 :

我的网址例如:http ://www.mywebsite.com/this_category/page1.php

我需要这个变成:http ://www.mywebsite.com/this-category/page1.php

4

3 回答 3

14

不,没有一个简单的方法可以做到这一点,但重写引擎仍然可以强制执行它,假设您可以对需要在单个 url 中转换的破折号数量设置合理的上限(或者即使您不这样做) t,见答案末尾。)

这是我的做法(经过测试的代码):

rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5-$6-$7-$8-$9;
rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5;
rewrite ^([^_]*)_([^_]*)_(.*)$ $1-$2-$3;
rewrite ^([^_]*)_(.*)$ $1-$2;

四个重写分别将 url 中的前 8、4、2 和 1 个下划线转换为破折号。每条规则中的下划线数量是故意 2 的递减幂。此块是最有效的规则集,可以将单个 url 中出现的 0 到 15 次下划线转换为使用匹配或不匹配每个单独规则的所有 16 种组合。

您还会注意到,我[^_]*在每条规则中都使用了除最后一个之外的每个组。这避免了正则表达式引擎在不匹配的情况下执行不需要的回溯。基本上,在正则表达式中有九个通用星会在“最坏情况”中.*导致 O(n 9 ) 复杂性(这非常糟糕),这是不匹配的,这实际上是您最常见的情况。(我可以向那些希望真正了解底层库如何实际执行正则表达式的人推荐这本书。)

出于这个原因,如果你可以将破折​​号的数量限制在 15 以内,我建议取消第一条规则,或者前两条。仅最后三个规则就可以翻译多达 7 个下划线;最后两个将翻译为 3。

最后,您没有提到将用户重定向到新网址。(与仅在带下划线的 url 和正确的 url 处提供内容相反,这通常会被搜索引擎坚果所反对。仅供参考。)如果这是您需要的,您将不得不将这些重写放入一个特殊的在 url 中存在下划线时触发的位置,并在四个重写结束时将用户重定向到新 url:

location ~ _ {
  rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5-$6-$7-$8-$9;
  rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5;
  rewrite ^([^_]*)_([^_]*)_(.*)$ $1-$2-$3;
  rewrite ^([^_]*)_(.*)$ $1-$2;
  rewrite ^ $uri permanent;
}

这还增加了在单个 url 中转换无限数量的下划线的好处,但代价是重定向到用户浏览器的次数更多。

高温;-P

于 2013-04-10T19:03:11.357 回答
3

从 2013 年 4 月到 2015 年,对这个问题的现有答案都相当不理想和丑陋——一个依赖于过多的复制粘贴并且错误处理/报告不明确,另一个涉及让301 Moved客户处理未定义数量的不必要交互.

有一个更好的方法,隐藏在2013 年 2 月的一对 QA 对中——就在 2013 年 4 月的这个问题之前的几个月!它涉及依赖http://nginx.org/r/rewritelast指令的参数,这将导致 nginx 停止处理重写指令,如果其中一个导致匹配,并返回寻找适当的“新”根据修改,在 nginx 中导致内部重定向循环最多 10 次(例如,10 个内部重定向,根据http://nginx.org/r/internal ),如果超过 10 个循环的限制,则记录 a 。lastlocation$uri500 Internal Server Error

从某种意义上说,这个答案与原来的答案相似,只是你免费获得了 10 倍的额外因子,从而减少了复制粘贴的要求。

# Replace maximum of 3 or 1 underscores per internal redirect,
# produce 500 Internal Server Error after 10 internal redirects, 
# supporting at least 28 underscores (9*3 + 1*1) and at most 30 (10*3).
location ~ _ {
    rewrite "^([^_]*)_([^_]*)_([^_]*)_(.*)$" $1-$2-$3-$4 last;
    rewrite "^([^_]*)_(.+)$" $1-$2 last;
    return 301 $uri;
}
于 2018-09-13T07:55:17.693 回答
2

这已经过时了,但我必须指出上面的答案需要更正,因为使用n不同数量的重写,其中n是 URL 中存在的下划线数量是完全不必要的。这个问题可以使用 3 种不同的位置指令和重写规则来解决,同时在其常规表达式中考虑以下场景:

  1. url 末尾有一个或多个下划线。
  2. url开头有一个或多个下划线
  3. url 的中间有一个或多个下划线

            location ~*^/(?<t1>\_+)(?<t2>[a-zA-Z0-9\-]*)$ { 
            return 301 $scheme://$host/-$t2; 
            }
    
            location ~*^/(?<t2>[a-zA-Z\_0-9\-]*)(?<t1>\_+)$ { 
            return 301 $scheme://$host/$t2-; 
            }
    
            location ~*^/(?<t2>[a-zA-Z0-9\-]*)(?<t1>\_+)(?<t3>[a-zA-Z0-9\-]*)$ { 
            return 301 $scheme://$host/$t2-$t3; 
            }
    

这三个指令将递归地用'-'替换所有下划线,直到没有留下

-愿意

于 2015-04-26T18:00:17.723 回答