1

我正在网页抓取一个页面,我被迫使用正则表达式(我不擅长)来提取我需要的信息,因为 HTML 的结构非常少。HTML 片段如下:

LEEDS TOWN HALL<br>
Wednesday, 15 May 2013, 6:30PM - 8:30PM<br>
Tickets £7/£5 for including a glass of wine available in store or via 01234 567 890

我想先在 html break 标签处将块分成三部分,然后使用正则表达式提取我需要的信息。

我如何将块分成三个开始?

谢谢

4

1 回答 1

0

您只需要一个包含 5 个组的正则表达式:

(?s)([^<]+).*?, (.*?) - (.*?)<br>(.*)

由于您没有尝试创建正则表达式,因此我没有尝试解释我的:)

于 2013-02-21T20:40:40.653 回答