2

我正在使用 JTidy(HTML Tidy 库的 Java 端口)来清理一些现有站点。当我使用我的 JTidy 配置时,似乎非常严格,最终切断了页面底部(标记错误)。

当我只通过 w3c HTML 验证器工具运行相同的标记时,它会清理它,但在重写时更智能;它似乎不是切断标签,而是智能地猜测丢失的标签在哪里,并相应地更新结构。

有谁知道 w3c 使用的 HTML-Tidy 配置?

我的 jtidy 配置如下:

    Tidy tidy = new Tidy();
    tidy.setTidyMark(false);
    tidy.setXHTML(true);
    tidy.setXmlOut(false);
    tidy.setNumEntities(true);        
    tidy.setSpaces(2);
    tidy.setWraplen(2000);
    tidy.setUpperCaseTags(false);
    tidy.setUpperCaseAttrs(false);
    tidy.setQuiet(false);
    tidy.setMakeClean(true);
    tidy.setShowWarnings(true);
    tidy.setBreakBeforeBR(true);
    tidy.setHideComments(true);
4

1 回答 1

2

W3C 验证器使用的整洁配置可在此处获得

于 2015-08-24T12:40:29.217 回答