1

我需要一些帮助来使用 Python 从 .sgm 文件中提取信息。是否有适合这种特定类型文件的特定库?或者用于从 .xml 文件中提取信息的库也能正常工作?如果没有可用的库,您能否建议我一个可以下载以处理 .sgm 文件的好模块?

最重要的是,如果有的话,你能解释一下 .xml 和 .sgm 文件之间的区别吗?

谢谢!

4

1 回答 1

2

以下是一些可用于解析 .sgm 文件的库:

两者之间的主要区别在于 SGML 允许以下内容:

未关闭的开始标签

未封闭的结束标签

空的开始标签

空的结束标签

参考

于 2013-03-13T00:57:56.363 回答