我有一个包含组织名称及其 URL 的长 HTML 文件。代码中每个组织的“部分”由“组织”一词划分,后跟大量代码,其 URL 位于该代码内,并以“组织”一词结尾。
例如:
组织——大量代码(URL 位于内部某处)——组织
我曾尝试使用正则表达式来搜索和提取 URL,但无济于事。
organization(?<Protocol>\w+):\/\/(?<Domain>[\w@][\w.:@]+)\/?[\w\.?=%&=\ @/$,]*organization
我怀疑我的问题在于我试图通过使用“组织”一词来划分对 URL 的搜索,但我不确定。