1

对于一个项目,我需要抓取一个页面(互联网上的任何页面)并对其进行操作。我正在为此使用 simplehtmldom(在此处找到),因为它很容易并且像魅力一样工作..主要是..我需要为某些元素设置一个类属性,其中一些确实已经有一个类属性,其中一些没有不。根据我发现的这篇文章,您可以通过以下方式添加属性:

$value = $e->attr['data-role'];

不幸的是,这对我不起作用。以下代码给出了这些错误:

if(!isset($elem->class))
{
    $elem->attr['class'] = "classname";
}
else
{
    $elem->class = $elem->class . " classname";
}

Notice: Undefined offset: 2 in simplehtmldom.php on line 483
Notice: Undefined offset: 2 in simplehtmldom.php on line 488
Notice: Undefined offset: 2 in simplehtmldom.php on line 494

在 simplehtmldom 中是以下内容:

function makeup()
{
    // text, comment, unknown
    if (isset($this->_[HDOM_INFO_TEXT])) return $this->dom->restore_noise($this->_[HDOM_INFO_TEXT]);

    $ret = '<'.$this->tag;
    $i = -1;

    foreach ($this->attr as $key=>$val)
    {
        ++$i;
            // skip removed attribute
        if ($val===null || $val===false)
            continue;
/* 483 */   $ret .= $this->_[HDOM_INFO_SPACE][$i][0];
        //no value attr: nowrap, checked selected...
        if ($val===true)
            $ret .= $key;
        else {
/* 488 */       switch ($this->_[HDOM_INFO_QUOTE][$i])
            {
                case HDOM_QUOTE_DOUBLE: $quote = '"'; break;
                case HDOM_QUOTE_SINGLE: $quote = '\''; break;
                default: $quote = '';
            }
/* 494 */   $ret .= $key.$this->_[HDOM_INFO_SPACE][$i][1].'='.$this->_[HDOM_INFO_SPACE][$i][2].$quote.$val.$quote;
        }
    }
    $ret = $this->dom->restore_noise($ret);
    return $ret . $this->_[HDOM_INFO_ENDSPACE] . '>';
}

我很难弄清楚为什么它不起作用。自从写这篇文章以来,它可能已经改变了,还是我在这里做错了什么?

4

1 回答 1

2

原来我问这个问题有点太早了。我找到了这个页面(API 参考),它告诉我们我们也可以使用以下 W3C 标准:

$e->setAttribute ( $name, $value )

所以而不是

$elem->attr['class'] = "classname";

你可以做

$elem->setAttribute("class","classname");

如果其他人遇到此问题并错过 API 参考页面,我会保留问题并回答。

于 2013-03-20T12:17:57.700 回答