0

我有一个从 Word 插入的 XML 文档。来自用户的细节有点粗略,但我相信 XML 是通过从 Word 复制插入的。所需的功能是将复制的 MS Word 格式的文本插入 xml 文档,将其存储在数据库中以供以后导出。最初的 XML 看起来不错,除了一个奇怪的标签。

 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

此标记具有不允许在 Visual Studio 2010 和 IE 8 中解析 XML 的效果。删除此标记后会出现另一个错误。

End tag 'FONT' does not match the start tag 'P'. Error processing resource 

似乎微软在 XML 标记内生成的 HTML 存在问题。我不是 XML 专家……MS 从 Word 生成的 HTML 有问题吗?为什么删除标签有帮助?

4

1 回答 1

0

MS Word 会产生糟糕的标记——在 XML 中存储是最糟糕的方法。如果您必须保留错误的格式数据,关系数据库将是更好的解决方案,否则将需要删除格式或手动更正它。

于 2013-03-12T21:58:40.113 回答