3

编写可以验证 HTML 的 python 模块的最佳方法是什么,尤其是嵌入式 RDFa?我熟悉validator.w3.org,并且我对编写一个执行类似功能的自定义验证器感兴趣,但是对于使用RDFa 元素元数据的不同标准。有哪些不错的源代码可供查看,Python 库可供尝试,有哪些需要注意的事项?

4

1 回答 1

2

埃米特,

我不确定你想要达到什么目的。我确实用 Python 编写了一个 RDFa 蒸馏器。您要问的第一个问题是您要考虑 XHTML 还是 HTML5。如果是前者,周围有一堆 XML 环境,还有用于 RDFa 的 DTD-s。那可以工作。对于 HTML5,您可能希望在 Python 中使用 HTML5 解析器,但它并不“了解” RDFa,但它可以生成,比如说,一个 DOM 树(或其他表示),然后您可以使用它来检查 RDFa 属性。但是请注意,HTML5 解析器不会执行“验证”,即针对各种可能的错误情况分析 HTML5 代码;它只是根据 HTML5 规范生成一个 DOM 树。

我希望这有帮助。

干杯

伊万

于 2012-06-22T10:15:12.607 回答