0

我有一个包含此类列表的网页,大约 500 项长:

<br><a href="urlvalue" >URL Name 1</a> text</br>
<br><a href="urlvalue" >URL with a longer url</a>text</br>
<br><a href="urlvalue" >URL Name3 and this one too?</a> text</br>

我想将此页面上的数据导入到excel中。所以,我想把这里的数据转换成这样的:

URL value  | URL Name | Text 

我实际上会满足于:

URL value | URL Name

我正在使用这个:

我使用了 simple-html-dom

<?php
require ('simple_html_dom.php');
$html = file_get_html('Etext_alt2.html');


foreach($html->find('a') as $element)
    echo $element->href .'<br>'; 
?>

这给了我一个很好的 URL 值列表。

似乎我应该能够访问其他属性,但没有任何效果。

我用错了吗?最好的方法是什么?

4

1 回答 1

-1

无需解析 HTML 即可完成任务的工作示例:

$html = '<br><a href="urlvalue" >URL Name 1</a> text</br>
<br><a href="urlvalue" >URL with a longer url</a>text</br>
<br><a href="urlvalue" >URL Name3 and this one too?</a> text</br>';

preg_match_all('#<br><a href="(.*)" >(.*)</a>(.*)</br>#', $html, $matches, PREG_SET_ORDER);

foreach ($matches as $row) {
    echo "{$row['1']} | {$row['2']} | {$row['3']}" . PHP_EOL;
}
于 2012-12-14T20:36:20.930 回答