我正在使用 OutWit Hub 从网站上抓取公司名称。
在某些页面中,HTML 标签是这样的:
<p style="font-weight: bold;">COMPANY NAME</p>
在其他页面中:
<span style="font-weight: bold;">COMPANY NAME</span>
所有页面都使用上述两个选项之一,但绝不会同时使用两者。
如果您不熟悉 OutWit Hub,它的工作原理是在您想要的信息之前询问标记,然后询问标记。
我正在尝试创建一个将检索公司名称的正则表达式,无论之前还是之后使用这些标记中的哪一个。
到目前为止,我已经为“之前”标签尝试过这个,但它不起作用:
/[<p style="font-weight: bold;">]|[<p>Name of Company: <span style="font-weight: bold;">]/
任何人都可以帮忙吗?