regex - 如何为此目的编写正则表达式？

Question

我想写一个正则表达式来解析这个网页（查看源：http://www.imdb.com/search/title?title=spiderman&title_type=feature）。基本上我想提取和之间的所有<tr class=".+">部分</tr>。该网页是来自 imdb(http://www.imdb.com/search/title?title=spiderman&title_type=feature) 的电影列表，这里的每个部分都表示一部电影。我尝试了正则表达式

<tr class=".+">(.+\n)+</tr>

但是，它不起作用。另外，我不允许使用 DOM。有没有人有什么建议？谢谢！

score 0 · Accepted Answer

我强烈建议您使用适当的解析器。但这是您的案例的正则表达式。

<tr class="(.+)">([\s\S]+?)</tr>

regex - 如何为此目的编写正则表达式？

1 回答 1

Related

Reference