1

如何从 xml 中删除任何有效字符但保持标准,例如我想从属性值内部字符串中删除所有 < 和 "

<log>
  <data id="1" name="No Error"  value="0" />
  <data id="2" name="Error "1" between text" value="0" />
  <data id="3" name="Error <2> between text"  value="0"  />
</log>

我怎样才能自然地删除引号包围“1”和<>包围2

最后的输出应该是

<log>
  <data id="1" name="No Error"  value="0"  />
  <data id="2" name="Error 1 between text" value="0" />
  <data id="3" name="Error 2 between text"  value="0"  />
</log>

感谢您的支持

我正在考虑以下解决方案:

  1. 以文本形式读取文件
  2. 修改任何以 开头<Name=>和结尾的 字符串<value=>
  3. 移除所有",<,>
  4. "后加<name=>"前加<value=>

如果这是正确的,我怎么能用 C# 做到这一点,替换方法将不起作用。

谢谢

4

2 回答 2

2

为了您的信息,我发现了两种不同的方式,

1-

public static void ReplaceInvalidCharFromAttribute(string filePath, string startElement, string nextElement, string[] removeStrings)
        {
            string tempFile = Path.GetTempFileName();

            using (var sr = new StreamReader(filePath))
            {
                using (var sw = new StreamWriter(tempFile))
                {
                    string line;
                    string temp;
                    while ((line = sr.ReadLine()) != null)
                    {
                        temp = RemoveInvalidCharFromAttribute(line, startElement, nextElement, removeStrings);
                        sw.WriteLine(temp??line);
                    }
                }
            }

            File.Delete(filePath);
            File.Move(tempFile, filePath);
        }



public static string RemoveInvalidCharFromAttribute(string input, string startElement, string nextElement, string[] invalidChars)
        {
            if (input.IndexOf(startElement) < 0 || input.IndexOf(nextElement) < 0) return null;
            int start =input.IndexOf(startElement) + startElement.Length;
            int end = input.IndexOf(nextElement);
            StringBuilder res = new StringBuilder(input.Substring(start, (end - start)));
            StringBuilder resCopy = new StringBuilder(res.ToString());

            foreach (string inv in invalidChars)
                res.Replace(inv, "");

            // return the result after surrounding the text with double 
            return
                input.Replace(
                resCopy.ToString(),
                (String.Concat("\"", String.Concat(res.ToString().Trim(), "\" "))));
        }

2- http://support.microsoft.com/kb/316063

所以太好了,谢谢

于 2012-07-02T13:00:38.033 回答
-1

在 PHP 中,在数据进入 XML 之前,我使用以下代码对数据进行编码:-

function xml_encode($string)
{
    $string=preg_replace("/&/", "&amp;", $string);
    $string=preg_replace("/</", "&lt;", $string);
    $string=preg_replace("/>/", "&gt;", $string);
    $string=preg_replace("/\"/", "&quot;", $string);
    $string=preg_replace("/%/", "&#37;", $string);

    return utf8_encode($string);
}

在您真正查看源代码之前,它看起来就像您在浏览器中建议的那样。

此时您需要检查“& amp;” 和十六进制/八进制代码。

希望能有所帮助。

于 2012-06-28T09:52:00.183 回答