1

我刚刚发现了 domdocument 并且之前一直在使用正则表达式 ..

我需要返回带有所有输入的整个表单元素。

我不需要创建一个完整的文档,我只想要那个部分,在一个我可以操作的字符串中。我一直在弄乱以下代码块,试图让它做一些有用的事情,但到目前为止,什么都没有。

在我回到正则表达式之前,任何人都可以理解这一点吗?

//get HTML into variable
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, 'https://www.openroadlending.com/Apply.aspx?aid=134');
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
$html=curl_exec($curl);

$dom = new domDocument;
@$dom->loadHTML($html);
$dom->preserveWhiteSpace=false;

$xpath = new DOMXPath($dom);
$body = $xpath->query('html/');

echo var_dump($body);

//echo $body->item(0);
$inputs = $xpath->getElementsByTagName('form');

// foreach($inputs as $in){
// $input = $in->saveHTML;
// //echo $input;
// }
4

2 回答 2

3

DOMXPath没有办法getElementsByTagName。您可以通过多种方法获取表格

  1. getElementsByTagName

    $forms = $dom->getElementsByTagName('form');
    
  2. XPath 查询

    $forms = $xpath->query('//form');
    

获得所需的表单后(通过从$forms集合中选择或使用更专业的 XPath 查询),您可以使用以下方式将 HTML 作为字符串获取

$formHTML = $dom->saveHTML($form);
于 2013-02-02T08:59:52.463 回答
2

你可以使用这个功能

function DOMinnerHTML($element) 
{ 
   $innerHTML = ""; 
   $children = $element->childNodes; 
   foreach ($children as $child) 
   { 
      $tmp_dom = new DOMDocument(); 
      $tmp_dom->appendChild($tmp_dom->importNode($child, true)); 
      $innerHTML.=trim($tmp_dom->saveHTML()); 
   } 
   return $innerHTML; 
}

并像这样使用

$productspec=$dom->getElementsByTagName('form')
foreach($productspec as $data)
{ 
   echo DOMinnerHTML($data);
}

您可以使用此功能按类获取元素

function GetBYClass($Doc,$ClassName){
    $finder = new DomXPath($Doc);
    return($finder->query("//*[contains(@class, '$ClassName')]"));
} 

并且此功能与此问题无关,但很有用

function ExtractText($node) {
     if($node==NULL)return false;    
     if (XML_TEXT_NODE === $node->nodeType || XML_CDATA_SECTION_NODE === $node->nodeType) {
         return $node->nodeValue;
     } else if (XML_ELEMENT_NODE === $node->nodeType || XML_DOCUMENT_NODE === $node->nodeType || XML_DOCUMENT_FRAG_NODE === $node->nodeType) {
       if ('script' === $node->nodeName) return '';

     $text = '';
     foreach($node->childNodes as $childNode) {
        $text .= $this->extractText($childNode);
     }
     return $text;
     }
}
于 2013-02-02T09:11:47.017 回答