4

我文件中的一列是 url 编码的,我必须对该列进行解码,并且需要根据列内的值执行一些操作。有什么方法可以在 awk 中解码该列?

4

1 回答 1

6

您必须根据您的文件格式对其进行调整,但基本原则在这里(使用 GNU Awk 3.1.7 测试):

sh$ echo 'Hello%2C%20world%20%21' | awk '
     {
         for (i = 0x20; i < 0x40; ++i) {
             repl = sprintf("%c", i);
             if ((repl == "&") || (repl == "\\"))
                 repl = "\\" repl;
             gsub(sprintf("%%%02X", i), repl);
             gsub(sprintf("%%%02x", i), repl);
         }
         print
     }
 '
Hello, world !

如果你有gawk,你可以把它包装在一个函数中(在下面的评论中感谢brendanh):

function urlDecode(url) {
    for (i = 0x20; i < 0x40; ++i) {
        repl = sprintf("%c", i);
        if ((repl == "&") || (repl == "\\")) {
            repl = "\\" repl;
        }
        url = gensub(sprintf("%%%02X", i), repl, "g", url);
        url = gensub(sprintf("%%%02x", i), repl, "g", url);
    }
    return url;
}
于 2013-06-08T19:14:09.980 回答