3

我的正则表达式成功验证了许多 URL,除了http://www.google

这是我在 JSFiddle 中的 URL 验证器:http: //jsfiddle.net/z23nZ/2/

它正确验证了以下 URL:

http://www.google.com

www.google.com

http://www.rootsweb.ancestry.com/~mopoc/links.htm

http:// www. 给出错误

...但不是这个:

http://www.google

在这种情况下返回 true 是不正确的。我如何验证该案例?

4

1 回答 1

1

我认为你需要简化这一点。那里有很多 URL 验证正则表达式,但作为练习,我将通过我的思考过程来构建一个。

  1. 首先,您需要匹配一个协议(如果有):/((http|ftp)s?:\/\/)?
  2. 然后匹配任何一系列非空白字符:\S+
  3. 如果您尝试从文本中挑选出 URL,则需要寻找表明它是 URL 的迹象。寻找点或斜线,然后寻找更多的非空白:[\.\/]\S*/

现在把它们放在一起:

/(((http|ftp)s?:\/\/)|(\S+[\.\/]))\S*[^\s\.]*/

我猜你试图寻找www.google是因为新的顶级域名......事实上,这样的 URL 可能看起来像google,所以任何单词都可能是 URL。试图想出一个匹配有效 URL 而没有其他任何东西的包罗万象的正则表达式是不可能的,所以你最好只使用像上面这样简单的东西。

编辑:如果人们选择编写这样的新 URL,我会|在协议部分和非空格然后点或斜线部分之间插入一个匹配的部分http://google

编辑 2:查看下一个改进的评论。它确保google.com匹配,http://google匹配,甚至google/匹配,但不是a..

于 2012-07-10T10:10:53.457 回答