1

我想自动删除 HTML 和 JavaScript 注释。我在服务器上使用 ant 脚本进行部署和 JSF。有哪些可用的选项或工具?提前致谢。

4

4 回答 4

2

用正则表达式替换混合了 HTML 和 JavaScript 的文件中的注释是有风险的。但是,单独地,您可以在不依赖外部工具的情况下获得良好的性能,只需要 node.js:

对于 HTML 注释,请使用正则表达式/<!--(?!>)[\S\s]*?-->/g。例子:

function stripHtmlComments(content) {
  return content.replace(/<!--(?!>)[\S\s]*?-->/g, '');
}

删除 JavaScript 注释有点复杂,您需要混合几个正则表达式来区分注释何时位于文字字符串或正则表达式中,以及斜杠何时属于正则表达式:)

这个小程序从 JavaScript 文件中删除多行和单行注释:

#!/usr/bin/env node
/*
  Removes multiline and single-line comments from a JavaScript source file.
  Author: aMarCruz - https://github.com/aMarCruz
  Usage: node [this-tool] [js-file]
*/
var path = require('path'),
    fs = require('fs'),
    file,
    str;

var RE_BLOCKS = new RegExp([
    /\/(\*)[^*]*\*+(?:[^*\/][^*]*\*+)*\//.source,           // $1: multi-line comment
    /\/(\/)[^\n]*$/.source,                                 // $2 single-line comment
    /"(?:[^"\\]*|\\[\S\s])*"|'(?:[^'\\]*|\\[\S\s])*'/.source, // string, don't care about embedded eols
    /(?:[$\w\)\]]|\+\+|--)\s*\/(?![*\/])/.source,           // division operator
    /\/(?=[^*\/])[^[/\\]*(?:(?:\[(?:\\.|[^\]\\]*)*\]|\\.)[^[/\\]*)*?\/[gim]*/.source
    ].join('|'),                                            // regex
    'gm'  // note: global+multiline with replace() need test
    );

file = process.argv[2];
if (!path.extname(file))
    file += '.js';
str = fs.readFileSync(file, { encoding: 'utf8' });

console.log(stripJSComments(str));

// remove comments, keep other blocks
function stripJSComments(str) {
    return str.replace(RE_BLOCKS, function (match, mlc, slc) {
        return mlc ? ' ' :     // multiline comment (must be replaced with one space)
               slc ? '' :      // single-line comment
               match;          // divisor, regex, or string, return as-is
        });
}

现在(示例)另存为rcomms并运行:

node rcomms source-file > clean-file.js

注意: 此代码基于 jspreproc 的正则表达式,如果您需要更高级的处理,请访问http://github.com/aMarCruz/jspreproc

我写了jspreproc来部署一些riot模块。jspreproc 删除空行,支持过滤器以保留 C 风格的一些注释和条件注释:#if-else、endif、#define、#include 等。

于 2015-09-25T18:22:47.283 回答
1

您可以使用正则表达式轻松删除它们。例如,您可以通过将正则表达式的匹配项替换为空来删除 HTML 注释/\<!--(.*)-\>/gi

于 2013-01-30T09:07:56.507 回答
1

decomment完全按照您的描述进行 - 从 JSON、JavaScript、CSS、HTML 等中删除注释。

如需在 gulp 系统中使用,请参阅gulp-decomment

于 2016-01-02T14:31:40.370 回答
0

创建一个新目标并用于replaceregexp替换这些文件中不需要的所有注释和其他内容。

你可以做某事。像 html 和 js 类似的东西:

<target name="-trim.html.comments">

    <fileset id="html.fileset"
        dir="${build.dir}"
        includes="**/*.jsp, **/*.php, **/*.html"/>

    <!-- HTML Comments -->
    <replaceregexp replace="" flags="g"
        match="\&lt;![ \r\n\t]*(--([^\-]|[\r\n]|-[^\-])*--[ \r\n\t]*)\&gt;">
        <fileset refid="html.fileset"/>
    </replaceregexp>

</target>

来源:http ://www.julienlecomte.net/blog/2007/09/23/

于 2013-01-30T09:08:05.327 回答