0

我正在使用 python 的 xml.sax 库来解析 XML 内容。我的 HTML 标记带有我的 XML 文件的一些标记。让我们说例如:

<Car>
<Color> Blue</Color>
<Size> 1500 </Size>
<Description><p>This is <b>new  in the market</b></p></Description>
</Car>

所以我目前得到的是

Color :   Blue  
Size  :   1500
Description : <
Description : p
Description : >
Description : This is 
Description : <
Description : b
Description : >
Description : new in the market
.... and so on.

我想要的是它返回:

Description - <p>This is <b>new in the market</p>

该文件非常大,所以我不能手动在 CDATA 中添加 HTML 标签此外我需要显示文件中的所有内容,有没有办法克服这个问题?

4

1 回答 1

0

保留您在进入描述节点时设置的状态变量,并关闭它以按照您想要的方式处理内部标记。离开时清除状态。

于 2013-08-07T15:00:11.497 回答