从 Java 验证 HTML 的快速简单的方法是什么?我正在寻找一个描述 100 多个 HTML 标签的各种属性的开源/PD 类(或一组类),例如:
- 标签是可选的吗?空的?省略结束标签是否合法?
- 该标签还可以包含哪些其他标签(如果有)?
- 该标签的哪些属性是合法的,它们的类型是什么?(不是必需的,但很高兴拥有)
谢谢!
编辑
我希望对 HTML 文档进行逐个标记的分析,因此我对整个文档是否有效不太感兴趣,而是对每种标记的具体要求是什么感兴趣。我可以根据 W3C 规范对规则进行编码,但想先看看哪些现成的解决方案可用。