有人可以帮助我们使用正则表达式来检测 URL 字符串中的重复模式吗?目标显然是检测格式错误的奇怪 URL。
例如,以下 URL 是可以的:
http://www.somewhere.com/help/content/21/23/en/
http://www.somewhere.com/help/content/21/24/en/
http://www.somewhere.com/help/content/21/64/en/
http://www.somewhere.com/help/content/21/65/en/
http://www.somewhere.com/help/content/21/67/en/
虽然这个这个是不正确的,应该标记:
http://www.somewhere.com/help/content/21/content/1/54/en/
http://www.somewhere.com/help/content/21/content/1/62/en/
http://www.somewhere.com/help/content/21/content/8/52/en/
由于内容重复了两次。到目前为止,我们一直在使用 parse_url 和 explode 来解决这个问题,但它看起来效率很低!
同样,我知道可能有许多 URL 在路径中重复数字或其他值,因此任何解决此问题的建议都将受到欢迎。
非常感谢!
为了更好地理解该问题,您可以访问以下链接并单击“Administrador MySQL”: