我想写一个正则表达式来解析这个网页(查看源:http://www.imdb.com/search/title?title=spiderman&title_type=feature)。基本上我想提取 和 之间的所有<tr class=".+">
部分</tr>
。该网页是来自 imdb(http://www.imdb.com/search/title?title=spiderman&title_type=feature) 的电影列表,这里的每个部分都表示一部电影。我尝试了正则表达式
<tr class=".+">(.+\n)+</tr>
但是,它不起作用。另外,我不允许使用 DOM。有没有人有什么建议?谢谢!