55

我使用 SimpleXML 访问了几个具有不同属性的相同元素:

<data>
    <seg id="A1"/>
    <seg id="A5"/>
    <seg id="A12"/>
    <seg id="A29"/>
    <seg id="A30"/>
</data>

我需要删除一个特定的seg元素,id 为“A12”,我该怎么做?我尝试遍历seg元素并取消设置特定的元素,但这不起作用,元素仍然存在。

foreach($doc->seg as $seg)
{
    if($seg['id'] == 'A12')
    {
        unset($seg);
    }
}
4

18 回答 18

60

与现有答案的普遍看法相反,每个 Simplexml 元素节点都可以单独从文档中删除,并且unset(). 以防万一,您需要了解 SimpleXML 的实际工作原理。

首先找到要删除的元素:

list($element) = $doc->xpath('/*/seg[@id="A12"]');

$element然后删除在您取消设置其自引用中表示的元素:

unset($element[0]);

这是因为任何元素的第一个元素都是 Simplexml 中的元素本身(自引用)。这与它的神奇特性有关,数字索引表示任何列表中的元素(例如父->子),甚至单个子也是这样的列表。

非数字字符串索引表示属性(在数组访问中)或子元素(在属性访问中)。

因此,属性访问中的数字不合理,例如:

unset($element->{0});

也可以工作。

当然,对于那个 xpath 示例,它相当简单(在 PHP 5.4 中):

unset($doc->xpath('/*/seg[@id="A12"]')[0][0]);

完整的示例代码(Demo):

<?php
/**
 * Remove a child with a specific attribute, in SimpleXML for PHP
 * @link http://stackoverflow.com/a/16062633/367456
 */

$data=<<<DATA
<data>
    <seg id="A1"/>
    <seg id="A5"/>
    <seg id="A12"/>
    <seg id="A29"/>
    <seg id="A30"/>
</data>
DATA;


$doc = new SimpleXMLElement($data);

unset($doc->xpath('seg[@id="A12"]')[0]->{0});

$doc->asXml('php://output');

输出:

<?xml version="1.0"?>
<data>
    <seg id="A1"/>
    <seg id="A5"/>

    <seg id="A29"/>
    <seg id="A30"/>
</data>
于 2013-04-17T14:23:23.217 回答
59

虽然SimpleXML提供了一种删除XML 节点的方法,但它的修改能力有些有限。另一种解决方案是使用DOM扩展。dom_import_simplexml()将帮助您将您的文件SimpleXMLElement转换为DOMElement.

只是一些示例代码(使用 PHP 5.2.5 测试):

$data='<data>
    <seg id="A1"/>
    <seg id="A5"/>
    <seg id="A12"/>
    <seg id="A29"/>
    <seg id="A30"/>
</data>';
$doc=new SimpleXMLElement($data);
foreach($doc->seg as $seg)
{
    if($seg['id'] == 'A12') {
        $dom=dom_import_simplexml($seg);
        $dom->parentNode->removeChild($dom);
    }
}
echo $doc->asXml();

输出

<?xml version="1.0"?>
<data><seg id="A1"/><seg id="A5"/><seg id="A29"/><seg id="A30"/></data>

顺便说一句:当您使用 XPath ( SimpleXMLElement->xpath )时,选择特定节点要简单得多:

$segs=$doc->xpath('//seq[@id="A12"]');
if (count($segs)>=1) {
    $seg=$segs[0];
}
// same deletion procedure as above
于 2008-11-04T17:14:48.653 回答
25

只需取消设置节点:

$str = <<<STR
<a>
  <b>
    <c>
    </c>
  </b>
</a>
STR;

$xml = simplexml_load_string($str);
unset($xml –&gt; a –&gt; b –&gt; c); // this would remove node c
echo $xml –&gt; asXML(); // xml document string without node c

此代码取自How to delete / remove nodes in SimpleXML

于 2008-12-27T06:04:48.597 回答
10

我相信 Stefan 的回答是正确的。如果您只想删除一个节点(而不是所有匹配的节点),这是另一个示例:

//Load XML from file (or it could come from a POST, etc.)
$xml = simplexml_load_file('fileName.xml');

//Use XPath to find target node for removal
$target = $xml->xpath("//seg[@id=$uniqueIdToDelete]");

//If target does not exist (already deleted by someone/thing else), halt
if(!$target)
return; //Returns null

//Import simpleXml reference into Dom & do removal (removal occurs in simpleXML object)
$domRef = dom_import_simplexml($target[0]); //Select position 0 in XPath array
$domRef->parentNode->removeChild($domRef);

//Format XML to save indented tree rather than one line and save
$dom = new DOMDocument('1.0');
$dom->preserveWhiteSpace = false;
$dom->formatOutput = true;
$dom->loadXML($xml->asXML());
$dom->save('fileName.xml');

请注意,加载 XML...(第一个)和 Format XML...(最后一个)部分可以替换为不同的代码,具体取决于您的 XML 数据来自哪里以及您想对输出做什么;它是找到一个节点并将其删除之间的部分。

此外,if 语句仅用于确保目标节点在尝试移动之前存在。您可以选择不同的方式来处理或忽略这种情况。

于 2009-11-25T09:04:49.173 回答
5

这对我有用:

$data = '<data>
<seg id="A1"/>
<seg id="A5"/>
<seg id="A12"/>
<seg id="A29"/>
<seg id="A30"/></data>';

$doc = new SimpleXMLElement($data);

$segarr = $doc->seg;

$count = count($segarr);

$j = 0;

for ($i = 0; $i < $count; $i++) {

    if ($segarr[$j]['id'] == 'A12') {
        unset($segarr[$j]);
        $j = $j - 1;
    }
    $j = $j + 1;
}

echo $doc->asXml();
于 2010-08-26T17:57:40.383 回答
4

如果您扩展基本 SimpleXMLElement 类,则可以使用此方法:

class MyXML extends SimpleXMLElement {

    public function find($xpath) {
        $tmp = $this->xpath($xpath);
        return isset($tmp[0])? $tmp[0]: null;
    }

    public function remove() {
        $dom = dom_import_simplexml($this);
        return $dom->parentNode->removeChild($dom);
    }

}

// Example: removing the <bar> element with id = 1
$foo = new MyXML('<foo><bar id="1"/><bar id="2"/></foo>');
$foo->find('//bar[@id="1"]')->remove();
print $foo->asXML(); // <foo><bar id="2"/></foo>
于 2010-09-10T19:13:23.877 回答
2

为了将来参考,使用 SimpleXML 删除节点有时会很痛苦,尤其是当您不知道文档的确切结构时。这就是我编写SimpleDOM的原因,这是一个扩展 SimpleXMLElement 以添加一些便利方法的类。

例如,deleteNodes() 将删除与 XPath 表达式匹配的所有节点。如果你想删除属性“id”等于“A5”的所有节点,你所要做的就是:

// don't forget to include SimpleDOM.php
include 'SimpleDOM.php';

// use simpledom_load_string() instead of simplexml_load_string()
$data = simpledom_load_string(
    '<data>
        <seg id="A1"/>
        <seg id="A5"/>
        <seg id="A12"/>
        <seg id="A29"/>
        <seg id="A30"/>
    </data>'
);

// and there the magic happens
$data->deleteNodes('//seg[@id="A5"]');
于 2009-11-15T15:44:31.830 回答
2

要删除/保留具有特定属性值或属于属性值数组的节点,您可以像这样扩展类(我的GitHub GistSimpleXMLElement中的最新版本):

class SimpleXMLElementExtended extends SimpleXMLElement
{    
    /**
    * Removes or keeps nodes with given attributes
    *
    * @param string $attributeName
    * @param array $attributeValues
    * @param bool $keep TRUE keeps nodes and removes the rest, FALSE removes nodes and keeps the rest 
    * @return integer Number o affected nodes
    *
    * @example: $xml->o->filterAttribute('id', $products_ids); // Keeps only nodes with id attr in $products_ids
    * @see: http://stackoverflow.com/questions/17185959/simplexml-remove-nodes
    */
    public function filterAttribute($attributeName = '', $attributeValues = array(), $keepNodes = TRUE)
    {       
        $nodesToRemove = array();

        foreach($this as $node)
        {
            $attributeValue = (string)$node[$attributeName];

            if ($keepNodes)
            {
                if (!in_array($attributeValue, $attributeValues)) $nodesToRemove[] = $node;
            }
            else
            { 
                if (in_array($attributeValue, $attributeValues)) $nodesToRemove[] = $node;
            }
        }

        $result = count($nodesToRemove);

        foreach ($nodesToRemove as $node) {
            unset($node[0]);
        }

        return $result;
    }
}

然后拥有您的$docXML,您可以删除您的<seg id="A12"/>节点调用:

$data='<data>
    <seg id="A1"/>
    <seg id="A5"/>
    <seg id="A12"/>
    <seg id="A29"/>
    <seg id="A30"/>
</data>';

$doc=new SimpleXMLElementExtended($data);
$doc->seg->filterAttribute('id', ['A12'], FALSE);

或删除多个<seg />节点:

$doc->seg->filterAttribute('id', ['A1', 'A12', 'A29'], FALSE);

仅保留<seg id="A5"/><seg id="A30"/>节点并删除其余节点:

$doc->seg->filterAttribute('id', ['A5', 'A30'], TRUE);
于 2016-08-29T09:25:13.103 回答
1

有一种方法可以通过 SimpleXml 删除子元素。该代码查找一个元素,但什么也不做。否则,它将元素添加到字符串中。然后它将字符串写出到文件中。另请注意,代码会在覆盖原始文件之前保存备份。

$username = $_GET['delete_account'];
echo "DELETING: ".$username;
$xml = simplexml_load_file("users.xml");

$str = "<?xml version=\"1.0\"?>
<users>";
foreach($xml->children() as $child){
  if($child->getName() == "user") {
      if($username == $child['name']) {
        continue;
    } else {
        $str = $str.$child->asXML();
    }
  }
}
$str = $str."
</users>";
echo $str;

$xml->asXML("users_backup.xml");
$myFile = "users.xml";
$fh = fopen($myFile, 'w') or die("can't open file");
fwrite($fh, $str);
fclose($fh);
于 2008-12-06T03:58:27.430 回答
1

一个新想法:simple_xml作为一个数组工作。

我们可以搜索要删除的“数组”的索引,然后使用unset()函数删除这个数组索引。我的例子:

$pos=$this->xml->getXMLUser();
$i=0; $array_pos=array();
foreach($this->xml->doc->users->usr[$pos]->u_cfg_root->profiles->profile as $profile) {
    if($profile->p_timestamp=='0') { $array_pos[]=$i; }
    $i++;
}
//print_r($array_pos);
for($i=0;$i<count($array_pos);$i++) {
    unset($this->xml->doc->users->usr[$pos]->u_cfg_root->profiles->profile[$array_pos[$i]]);
}
于 2010-03-17T10:55:20.977 回答
0

关于辅助函数的想法来自php.net上对 DOM 的评论之一,关于使用 unset 的想法来自kavoir.com。对我来说,这个解决方案终于奏效了:

function Myunset($node)
{
 unsetChildren($node);
 $parent = $node->parentNode;
 unset($node);
}

function unsetChildren($node)
{
 while (isset($node->firstChild))
 {
 unsetChildren($node->firstChild);
 unset($node->firstChild);
 }
}

使用它: $xml 是 SimpleXmlElement

Myunset($xml->channel->item[$i]);

结果存储在 $xml 中,因此不必担心将其分配给任何变量。

于 2009-08-21T13:50:55.470 回答
0

尽管 SimpleXML 没有删除元素的详细方法,但您可以使用 PHP 的unset(). 做到这一点的关键是设法定位所需的元素。至少一种进行定位的方法是使用元素的顺序。首先找出要删除的元素的订单号(例如使用循环),然后删除该元素:

$target = false;
$i = 0;
foreach ($xml->seg as $s) {
  if ($s['id']=='A12') { $target = $i; break; }
  $i++;
}
if ($target !== false) {
  unset($xml->seg[$target]);
}

您甚至可以通过将目标项目的订单号存储在数组中来删除多个元素。请记住以相反的顺序进行移除 ( array_reverse($targets)),因为移除一个项目自然会减少其后项目的订单号。

诚然,这有点像hackaround,但它似乎工作正常。

于 2009-10-11T13:45:51.573 回答
0

我也在为这个问题而苦苦挣扎,答案比这里提供的要容易得多。您可以使用 xpath 查找它并使用以下方法取消设置它:

unset($XML->xpath("NODESNAME[@id='test']")[0]->{0});

此代码将查找一个名为“NODESNAME”的节点,其 id 属性为“test”,并删除第一个出现的节点。

记得使用 $XML->saveXML(...) 保存 xml;

于 2013-05-22T12:29:01.663 回答
0

由于我遇到了和 Gerry 一样的致命错误,而且我对 DOM 不熟悉,所以我决定这样做:

$item = $xml->xpath("//seg[@id='A12']");
$page = $xml->xpath("/data");
$id = "A12";

if (  count($item)  &&  count($page) ) {
    $item = $item[0];
    $page = $page[0];

     // find the numerical index within ->children().
    $ch = $page->children();
    $ch_as_array = (array) $ch;

    if (  count($ch_as_array)  &&  isset($ch_as_array['seg'])  ) {
        $ch_as_array = $ch_as_array['seg'];
        $index_in_array = array_search($item, $ch_as_array);
        if (  ($index_in_array !== false)
          &&  ($index_in_array !== null)
          &&  isset($ch[$index_in_array])
          &&  ($ch[$index_in_array]['id'] == $id)  ) {

             // delete it!
            unset($ch[$index_in_array]);

            echo "<pre>"; var_dump($xml); echo "</pre>";
        }
    }  // end of ( if xml object successfully converted to array )
}  // end of ( valid item  AND  section )
于 2013-07-02T13:15:01.567 回答
0

使用FluidXML,您可以使用 XPath 选择要删除的元素。

$doc = fluidify($doc);

$doc->remove('//*[@id="A12"]');

https://github.com/servo-php/fluidxml


XPath//*[@id="A12"]意味着:

  • 在文件的任何一点 ( //)
  • 每个节点 ( *)
  • 属性id等于A12( [@id="A12"])。
于 2016-01-23T23:33:03.310 回答
0

如果您想剪切相似(非唯一)子元素的列表,例如 RSS 提要的项目,您可以使用以下代码:

for ( $i = 9999; $i > 10; $i--) {
    unset($xml->xpath('/rss/channel/item['. $i .']')[0]->{0});
}

它将RSS的尾部减少到10个元素。我试图删除

for ( $i = 10; $i < 9999; $i ++ ) {
    unset($xml->xpath('/rss/channel/item[' . $i . ']')[0]->{0});
}

但它以某种方式随机工作并且只削减了一些元素。

于 2016-03-09T09:07:22.943 回答
0

我有一个类似的任务 - 删除已经具有指定属性的子元素。换句话说,删除 xml 中的重复项。我有以下xml结构:

<rups>
    <rup id="1">
         <profiles> ... </profiles>
         <sections>
             <section id="1.1" num="Б1.В" parent_id=""/>
             <section id="1.1.1" num="Б1.В.1" parent_id="1.1"/>
             ...
             <section id="1.1" num="Б1.В" parent_id=""/>
             <section id="1.1.2" num="Б1.В.2" parent_id="1.1"/>
             ...
         </sections>
    </rup>
    <rup id="2">
         ...
    </rup>
    ...
 </rups>

例如,rups/rup[@id='1']/sections/section[@id='1.1']元素是重复的,我只需要留下第一个。我正在使用对元素数组的引用,loop-for 和 unset():

$xml = simplexml_load_file('rup.xml');
foreach ($xml->rup as $rup) {
    $r_s = [];
    $bads_r_s = 0;
    $sections = &$rup->sections->section;
    for ($i = count($sections)-1; $i >= 0; --$i) {
        if (in_array((string)$sections[$i]['id'], $r_s)) {
            $bads_r_s++;
            unset($sections[$i]);
            continue;
        }
        $r_s[] = (string)$sections[$i]['id'];
    }
}
$xml->saveXML('rup_checked.xml');
于 2021-09-30T12:59:56.340 回答
-2

您最初的方法是正确的,但是您忘记了关于 foreach 的一点小事。它不适用于原始数组/对象,但会在迭代时创建每个元素的副本,因此您确实取消了副本。像这样使用参考:

foreach($doc->seg as &$seg) 
{
    if($seg['id'] == 'A12')
    {
        unset($seg);
    }
}
于 2010-03-13T02:36:25.567 回答