我有一些使用 SGML 构建的文档,并且我有一个描述这种结构的 DTD 文件。
有人可以向我推荐一个 Python-3 兼容的库或模块来解析这些数据吗?对于 Python 2.x,我的 Google-fu 似乎出现了SGMLParser,但现在当然不推荐使用(并且从 Py3k 中彻底删除)。
许多人似乎建议lxml
,但由于依赖问题,这对我来说不是一个选择。
我知道BeautifulSoup
这对于混乱的标记很有用,但是 A)最后我听说它不兼容 py3k,并且 B)这个内容结构良好。
我有一些使用 SGML 构建的文档,并且我有一个描述这种结构的 DTD 文件。
有人可以向我推荐一个 Python-3 兼容的库或模块来解析这些数据吗?对于 Python 2.x,我的 Google-fu 似乎出现了SGMLParser,但现在当然不推荐使用(并且从 Py3k 中彻底删除)。
许多人似乎建议lxml
,但由于依赖问题,这对我来说不是一个选择。
我知道BeautifulSoup
这对于混乱的标记很有用,但是 A)最后我听说它不兼容 py3k,并且 B)这个内容结构良好。