我文件中的一列是 url 编码的,我必须对该列进行解码,并且需要根据列内的值执行一些操作。有什么方法可以在 awk 中解码该列?
问问题
3593 次
1 回答
6
您必须根据您的文件格式对其进行调整,但基本原则在这里(使用 GNU Awk 3.1.7 测试):
sh$ echo 'Hello%2C%20world%20%21' | awk '
{
for (i = 0x20; i < 0x40; ++i) {
repl = sprintf("%c", i);
if ((repl == "&") || (repl == "\\"))
repl = "\\" repl;
gsub(sprintf("%%%02X", i), repl);
gsub(sprintf("%%%02x", i), repl);
}
print
}
'
Hello, world !
如果你有gawk
,你可以把它包装在一个函数中(在下面的评论中感谢brendanh):
function urlDecode(url) {
for (i = 0x20; i < 0x40; ++i) {
repl = sprintf("%c", i);
if ((repl == "&") || (repl == "\\")) {
repl = "\\" repl;
}
url = gensub(sprintf("%%%02X", i), repl, "g", url);
url = gensub(sprintf("%%%02x", i), repl, "g", url);
}
return url;
}
于 2013-06-08T19:14:09.980 回答