我正在网页抓取一个页面,我被迫使用正则表达式(我不擅长)来提取我需要的信息,因为 HTML 的结构非常少。HTML 片段如下:
LEEDS TOWN HALL<br>
Wednesday, 15 May 2013, 6:30PM - 8:30PM<br>
Tickets £7/£5 for including a glass of wine available in store or via 01234 567 890
我想先在 html break 标签处将块分成三部分,然后使用正则表达式提取我需要的信息。
我如何将块分成三个开始?
谢谢