0

你好 ,

我使用以下代码从 URL 中检索 DOM 所有“A”标签并打印它们的 HREF 现在我的输出包含“A”我不希望它的输出在这里 http://trend.remal.com/parsing.php

我需要把我的名字清除为http://twitter.com/namehere之后的名字

所以输出“namehere”的打印列表

    include('simple_html_dom.php');

 // Retrieve the DOM from a given URL
 $html = file_get_html('http://tweepar.com/sa/1/');
 $urls = array();

  foreach ( $html->find('a') as $e )
  {
  // If it's a twitter link
  if ( strpos($e->href, '://twitter.com/') !== false )
  {
    // and we don't have it in the array yet
    if ( ! in_array($urls, $e->href) )
    {
        // add it to our array
        $urls[] = $e->href;
    }
   }
   }

  echo implode('<br>', $urls);

echo $e->href . '<br>';
4

1 回答 1

2

不要简单地使用$urls[] = $e->href,而是使用正则表达式来匹配用户名:

preg_match('~twitter.com/(.+)~', $e->href, $matches);
$urls[] = $matches[1];
于 2012-09-09T10:50:19.417 回答