1

我试图通过我指向的标签将 html 文件分隔为 2。

例子

<html>
   <head>
       <title>html title</title>
   </head>
   <body>
       <h1>hello title</h1>
       <p class="p2">
         <span>here is some txt</span>
       </p>
       <p class="p2">
         hello test, <a id="chp"></a>here is some txt
       </p>
   </body>
</html>

如果我定义分隔符是<a id="chp"></a>。这两个文件应该如下

文件 1:

<html>
   <head>
       <title>html title</title>
   </head>
   <body>
       <h1>hello title</h1>
       <p class="p2">
         <span>here is some txt</span>
       </p>
       <p class="p2">
         hello test,
       </p>
   </body>
</html>

文件 2:

<html>
   <head>
       <title>html title</title>
   </head>
   <body>
       <h1>hello title</h1>
       <p class="p2">
         <span>here is some txt</span>
       </p>
       <p class="p2">
         <a id="chp"></a>here is some txt
       </p>
   </body>
</html>

谁能告诉我如何实现这个?

谢谢

4

1 回答 1

0

如果使用SimpleXML库加载 html,则可以遍历 HTML 对象来检查每个元素。如果您检查每个元素的子节点,在移动到下一个之前,对于标签为a且具有属性id= 'chp' 的元素,您可以中断复制并删除该元素之后的内容(直到父节点结束element),克隆 SimpleXML 对象,然后用从以前的 SimpleXML 对象复制的内容替换整个元素。

于 2013-03-08T12:37:42.390 回答