我在 python 中寻找 URL 正则表达式,在阅读堆栈溢出后,我决定采用这个:http ://daringfireball.net/2010/07/improved_regex_for_matching_urls并在我的 python 代码中使用它。
我放了这样的东西:
reg_url =
re.compile(r"""((?:[a-z][\w-]+:(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|(([^\s()<>]+|(([^\s()<>]+)))\*))+(?:(([^\s()<>]+|(([^\s()<>]+)))\*)|[^\s`!()[]{};:`".,<>?«»“”‘’]))""",
re.DOTALL)
(Python 2.7)
使用该正则表达式运行我的代码后,我收到以下错误:
\xe2
SyntaxError:第 60 行文件中的非 ASCII 字符“ ”file.py
,但未声明编码;有关详细信息,请参见http://www.python.org/peps/pep-0263.html
解决此问题的最佳方法是什么?