我有以下 html 页面。我只想在 C# 中的第一个表标记内提取数据。html页面代码是:
<table cellpadding=2 cellspacing=0 border=0 width=100%>
<tbody>
<tr>
<td align=right><b>11/09/2013 at 09:48</b></td>
</tr>
</tbody>
</table>
<center>
<table border="1" bordercolor="silver" cellpadding="2" cellspacing="0" width="100%">
<thead>
<tr>
<th width=100>ETA</th>
<th width=100>Ship Name</th>
<th width=80>From port</th>
<th width=80>To berth</th>
<th width=130>Agent</th>
</tr>
</thead>
<tbody>
<tr><td>11/09/2013 at 09:00 </td>
<td>SONANGOL KALANDULA </td>
<td>Cabinda </td>
<td>Valero 6 </td>
<td>Graypen </td>
</tr>
</tbody>
</table>
更具体地说,我只想提取具有日期11/09/2013 at 09:48
的行,下面提到的代码位于我正在使用正则表达式的第一个标签下
"<table[^>]*>([^<]*(?:(?!</table)<[^<]*)*)[</table>]*"
但是有了这个,我得到了整个页面源,即我在所有表格标签之间获取数据,但我只想要第一个表格标签之间的文本。
谁能告诉我正则表达式,我只能从整个 html 页面中提取这个特定部分?