0

我需要删除/忽略 HTML 中的重复属性。我使用 xerces2 html 解析器。它不会解析标签中具有重复属性的 HTML 文件。

例子:

<img src="url" width="100" height="200" width="123">
4

1 回答 1

0

您可以尝试使用cyber neko html parser 来解析您的html 文件。 http://sourceforge.net/projects/nekohtml/

于 2013-02-08T08:45:12.023 回答