-1

我想知道是否有任何方法可以.txt使用c++and来创建 XML 文件libxml

输入文件如下所示:

"< url   >..........< / url>
<description>His work points a way forward for saving the oceans' health -- and humanity's.</description>
<keywords>fish,health,mission blue,oceans,science</keywords>
<talkid>899</talkid>
<title>Stephen Palumbi: Following the mercury trail</title>
<transcript>
It can be a very complicated thing, the ocean.
And it can be a very complicated thing, what human health is. " 

after transcript I have a huge text
after the tag </transcript>

另一个集团以相同的结构开始,我想要的是构建整个事物并将元数据重新组合在一起,因为之后我需要单独处理文本。

4

2 回答 2

0

.txt文件以或.xml.whatnot无关的事实结尾。

添加.*到文件名只是一个约定。一种节省您打开每个文件以验证格式的时间的方法,或者为程序提供提示以便它知道它正在处理什么。提示是关键字——文件可以有任意名称,它们不强制遵循约定。

打开一个有效xml的格式化文件是相同的过程,无论文件名是否以结尾.xml

编辑

您说该文件有许多XML块,但XML本身不是 -XML确实需要一个最外面的标签。只需在文件的开头和结尾添加<root>和。如果需要,</root>将其重命名为。xml

换句话说,您应该问自己的问题是如何在向XML解析器提供文件之前和之后提供额外的数据。像这样的东西:

parser.feed('<root>')
parser.feed(read('file.txt'))
parser.feed('</root>')
于 2013-03-22T11:33:02.947 回答
0

了解什么是有效的 xml 文档很重要?简而言之,它必须满足 DTD 或模式(xml 模式、relaxng 模式、schematron 或其他约束)才能有效。

从问题的措辞来看,它很可能会问:

“如何确保文件包含格式良好的 XML 文档,并读取这些元素?XML 是在扩展名为 .text 的文件中还是在 uʍopǝpısdn 答案中提到的其他文件中都没有关系”。

答案是,如果 XML 文档可以被兼容的 XML 解析器成功解析,那么它就是格式良好的。因此,假设您的文本文件包含格式良好的 XML,那么任何兼容的 XML 解析器都可以读取它......

您可以通过阅读“文本”文件自己尝试

http://www.xmlsoft.org/
http://www.grinninglizard.com/tinyxml/

也值得一看

http://www.w3schools.com/xml/xml_whatis.asp
于 2013-03-22T12:31:38.777 回答