0

你好 ,

我使用以下代码从 URL 中检索 DOM ind 所有“A”标签并打印它们的 HREF 现在我的输出包含“A”我不希望它在这里 http://trend.remal.com/parsing.php 一些元素重复,我需要清除我的只有“A”,其中包括 https://twitter.com/ $namehere,因为你可以看到我有 2 种 url 我只需要 twitter url 并避免重复任何调整提示编码

<?php
include('simple_html_dom.php');

 $html = file_get_html('http://tweepar.com/sa/1/');
 foreach($html->find('a') as $e) 
 echo $e->href . '<br>';
 ?>
4

1 回答 1

1
$urls = array();

foreach ( $html->find('a') as $e )
{
    // If it's a twitter link
    if ( strpos($e->href, '://twitter.com/') !== false )
    {
        // and we don't have it in the array yet
        if ( ! in_array($e->href, $urls) )
        {
            // add it to our array
            $urls[] = $e->href;
        }
    }
}

echo implode('<br>', $urls);

以下是 PHP 文档中的一些参考资料:

于 2012-09-09T10:04:12.840 回答