1

我正在使用 cURL 检索 HTML 页面。html页面有一个这样的表格。

<table class="table2" style="width:85%; text-align:center">
<tr>
<th>Refference ID</th>
<th>Transaction No</th>
<th>Type</th>
<th>Operator</th>
<th>Amount</th>
<th>Slot</th>
</tr>
<tr>
<td>130717919020ffqClE0nRaspoB</td>
<td>8801458920369</td>
<td>Purchase</td>
<td>Visa</td>
<td>50</td>
<td>20130717091902413</td>
</tr>
</table>

这是该 HTML 页面中唯一的表格。我需要使用 PHP 提取参考 ID 和插槽。

但不知道如何做到这一点。

编辑: 这个对帮助很大。

4

2 回答 2

1

像接受的答案这样的基于正则表达式的解决方案不是从 HTML 文档中提取信息的正确方法。

改用这样的DOMDocument基于解决方案:

$str = '<table class="table2" style="width:85%; text-align:center">
<tr>
<th>Refference ID</th>
  ...
<th>Slot</th>
</tr>
<tr>
<td>130717919020ffqClE0nRaspoB</td>
  ...
<td>20130717091902413</td>
</tr>
</table>';

// Create a document out of the string. Initialize XPath
$doc = new DOMDocument();
$doc->loadHTML($str);
$selector = new DOMXPath($doc);

// Query the values in a stable and easy to maintain way using XPath
$refResult = $selector->query('//table[@class="table2"]/tr[2]/td[1]');
$slotResult = $selector->query('//table[@class="table2"]/tr[2]/td[6]');

// Check if the data was found
if($refResult->length !== 1 || $slotResult->length !== 1) {
   die("Data is corrupted");
}

// XPath->query always returns a node set, even if 
// this contains only a single value.
$refId = $refResult->item(0)->nodeValue;
$slot = $slotResult->item(0)->nodeValue;

echo "RefId: $refId, Slot: $slot", PHP_EOL;
于 2015-06-27T07:10:56.280 回答
0
$str = '<table class="table2" style="width:85%; text-align:center">
<tr>
<th>Refference ID</th>
<th>Transaction No</th>
<th>Type</th>
<th>Operator</th>
<th>Amount</th>
<th>Slot</th>
</tr>
<tr>
<td>130717919020ffqClE0nRaspoB</td>
<td>8801458920369</td>
<td>Purchase</td>
<td>Visa</td>
<td>50</td>
<td>20130717091902413</td>
</tr>
</table>';

preg_match_all('/<td>([^<]*)<\/td>/', $str, $m);

$reference_id = $m[1][0];
$slot = $m[1][5];
于 2013-07-17T03:56:01.257 回答