1

这是xml内容。

<w:tbl xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main">
  <w:tr>
      <w:tc>
         <w:p>
           <w:r><w:t>1</w:t></w:r>
         </w:p>
         <w:p /> <!-- needs to remove -->
         <w:p /> <!-- needs to remove -->
       </w:tc>
       <w:tc>
         <w:p>
           <w:r><w:t>2</w:t></w:r>
         </w:p>
         <w:p />  <!-- needs to remove -->
         <w:p />  <!-- needs to remove -->
       </w:tc>
  </w:tr>
  <w:tr>
      <w:tc>
         <w:p>
           <w:r><w:t>3</w:t></w:r>
         </w:p>
         <w:p />  <!-- needs to remove -->
         <w:p />  <!-- needs to remove -->
       </w:tc>
       <w:tc>
         <w:p>
           <w:r><w:t>4</w:t></w:r>
         </w:p>
         <w:p />  <!-- needs to remove -->
         <w:p />  <!-- needs to remove -->
       </w:tc>
  </w:tr>
</w:tbl>

实际上这个xml内容是由html到ooxml转换器[HtmlToOpenXml.dll]生成的。但是它错误地<w:p>在每个元素的末尾添加了两个元素。所以<w:tc>,我想<w:p>从转换器生成的xml内容中删除这些元素。我有字符串格式的 xml 内容。

请指导我摆脱这个问题......

4

3 回答 3

6

你可以只使用字符串替换吗?

xmlString.Replace("<w:p />", "");
于 2012-09-13T05:12:47.617 回答
1

如果一切都那么简单,我强烈建议使用@sylon 的答案。无论如何,这是一个如何使用 LINQ to XML 执行此操作的简单示例:

        XElement x = XElement.Load("In.xml");
        string prefix = "w";
        XNamespace w = x.GetNamespaceOfPrefix(prefix);
        var ds = x.Descendants(w + "p")
                  .Where(d => string.IsNullOrEmpty(d.Value));
        ds.Remove();
        x.Save("Out.xml");

Where如果您需要删除一些更具体的标签,该子句可以包含更具体的条件。

于 2012-09-13T05:50:13.777 回答
1
string xmlString = @"<w:tbl xmlns:w='http://schemas.openxmlformats.org/wordprocessingml/2006/main'>
      <w:tr>
          <w:tc>
             <w:p>
               <w:r><w:t>1</w:t></w:r>
             </w:p>
             <w:p /> <!-- needs to remove -->
             <w:p /> <!-- needs to remove -->
           </w:tc>
           <w:tc>
             <w:p>
               <w:r><w:t>2</w:t></w:r>
             </w:p>
             <w:p />  <!-- needs to remove -->
             <w:p />  <!-- needs to remove -->
           </w:tc>
      </w:tr>
      <w:tr>
          <w:tc>
             <w:p>
               <w:r><w:t>3</w:t></w:r>
             </w:p>
             <w:p />  <!-- needs to remove -->
             <w:p />  <!-- needs to remove -->
           </w:tc>
           <w:tc>
             <w:p>
               <w:r><w:t>4</w:t></w:r>
             </w:p>
             <w:p />  <!-- needs to remove -->
             <w:p />  <!-- needs to remove -->
           </w:tc>
      </w:tr>
    </w:tbl>";

XDocument doc = XDocument.Parse(xmlString);
doc.Root.Descendants().Where(d => d.IsEmpty && !d.HasAttributes).Remove();
于 2012-09-13T05:53:42.343 回答