我正在尝试以以下形式查找网页上的所有链接,"http://something"
或者https://something.
我制作了一个正则表达式并且它有效:
L = re.findall(r"http://[^/\"]+/|https://[^/\"]+/", site_str)
但是,有没有更短的方法来写这个?我重复了 ://[^/\"]+/ 两次,可能没有任何必要。我尝试了各种东西,但它不起作用。我试过:
L = re.findall(r"http|https(://[^/\"]+/)", site_str)
L = re.findall(r"(http|https)://[^/\"]+/", site_str)
L = re.findall(r"(http|https)(://[^/\"]+/)", site_str)
很明显我在这里遗漏了一些东西,或者我对 python 正则表达式的理解不够。