数据:
<tr>
<td>
<a href="somelink">
some. .data...
</a>
</td>
<td>Black</td>
<td>57234</td>
<td>5431.60</td>
<td><font class="down"> -125.02</font></td>
</tr><tr>
<td>
<a href="somelink">
some. .data...
</a>
</td>
<td>Blue</td>
<td>57234</td>
<td>5431.60</td>
<td><font class="up"> -125.02</font></td>
</tr><tr>
<td>
<a href="somelink">
some. .data...
</a>
</td>
<td>Brown</td>
<td>57234</td>
<td>5431.60</td>
<td><font class="down"> -125.02</font></td>
</tr>
...more data...
我想提取一些。。数据...'; '黑色的'; '57234'; '5431.60'; 一次。[第五个td
数据不是必需的。]
最初,
<tr><td><a.*>([a-zA-Z0-9 -]+)</a></td><td>(\w+)</td><td>([\d]+\.\d+)</td><td>(\d+\.\d+)</td>
正在工作。(通过命中和未命中方法)
但是,现在它坏了。
现在,当我使用<td>(.*)</td>
or时,它会显示每个 tr 中<\w+>(.*)</\w+>
最后四个 s 的数据。td
但是,为什么它不会显示<a href...>...</a>
,我怎样才能得到我想要的数据?