我在 html 敏捷包的帮助下解析 html 文件以从 html 文件中提取表数据。但是有一些 html 文件没有可选的结束标签,或者没有可选的起始标签。因此 html 敏捷包无法正确解析该 html 页面。如果我在记事本 ++ 中打开该 html 文件的内容然后使用选项TestFX-->TestFX HTML Tidy-->TiDy clean document
并使内容像这样整洁。现在这个文件如果我用 html 敏捷包解析,那么它会正确解析它。
使用 notepad++ 整理 html 页面是最好的选择。
所以我不知道,但用户不能这样做,首先他/她用记事本++整理页面然后继续。那我该怎么办?
编辑我使用了 html tidy pack,但在某些情况下,有一些文件没有被解析,但如果我在记事本++中使这个页面整洁,那么它就会被解析。