我需要删除/忽略 HTML 中的重复属性。我使用 xerces2 html 解析器。它不会解析标签中具有重复属性的 HTML 文件。
例子:
<img src="url" width="100" height="200" width="123">
我需要删除/忽略 HTML 中的重复属性。我使用 xerces2 html 解析器。它不会解析标签中具有重复属性的 HTML 文件。
例子:
<img src="url" width="100" height="200" width="123">
您可以尝试使用cyber neko html parser 来解析您的html 文件。 http://sourceforge.net/projects/nekohtml/