晚上的人(或早上,取决于你在哪里:))。
我正在寻找一个包含多个片段的网页,类似于以下内容:-
> <p><a name="Abercrombie"></a></p> <h3>Abercrombie Council</h3> <p>Mr
> Billy Smith<br />The Managing Director<br />123 Jones Street,
> London<br />T:02081234567<br /><a
> href="mailto:billysmith@example.com">Email</a></p>
我想要做的是从网页中捕获源代码,然后对其进行解析,提取上面的唯一信息,并将其放入制表符分隔的文档中的行中,最后换行 - 拆分标题、名称办公室、个人姓名、工作角色、地址、电话号码、电子邮件地址。
我一直在考虑使用 BeautifulSoup,但我只是想知道是否还有其他更合适的工具?