1

可能重复:
仅从 php 中使用 preg_match_all 的 html 表中获取数据

HTML:

   <div class="table">
       <dl>
            <dt>ID:</dt>
            <dd>632991</dd>
            <dt>Type:</dt>
            <dd>NEW</dd>
            <dt>Body Type:</dt>
            <dd>Compact</dd>
        </dl>
    </div>

在 PHP 中使用 simple_html_dom 获得此功能的最佳方法是什么:

PHP:

$option = array(
    'id' => 632991,
    'Type' => 'NEW',
    'Body Type' => 'Compact'
 );
4

1 回答 1

1

您可以使用 XPath:

通过类名获取 DOM 元素

获取元素 ByTag 名称

使用 PHP 获取 DOM 元素

这里有很多关于 Stackoverflow 的帖子。在此处使用搜索。

编辑:

<?php

$dom = new DOMDocument();
$dom->loadHTML('<div class="table">
       <dl class="list">
            <dt>ID:</dt>
            <dd>632991</dd>
            <dt>Type:</dt>
            <dd>NEW</dd>
            <dt>Body Type:</dt>
            <dd>Compact</dd>
        </dl>
    </div>');

$nodes = $dom->getElementsByTagName('dl');
foreach ($nodes as $node) {
    var_dump(getArray($node));
}

function getArray($node) { 
    $array = false; 

    if ($node->hasAttributes()) { 
        foreach ($node->attributes as $attr) { 
            $array[$attr->nodeName] = $attr->nodeValue; 
        } 
    } 

    if ($node->hasChildNodes()) { 
        if ($node->childNodes->length == 1) { 
            $array[$node->firstChild->nodeName] = $node->firstChild->nodeValue; 
        } else { 
            foreach ($node->childNodes as $childNode) { 
                if ($childNode->nodeType != XML_TEXT_NODE) { 
                    $array[$childNode->nodeName][] = getArray($childNode); 
                } 
            } 
        } 
    } 
    return $array; 
} 
?>

函数 getArray 来自 php.net

于 2012-10-09T15:24:07.123 回答