0

我想知道是否有人对将字符代码数组转换为 Unicode 字符并使用正则表达式搜索它们有任何见解。

如果你有

var a = [0,1,2,3]

您可以使用循环将它们转换为 unicode 中前四个控制字符的字符串。

但是,如果您想创建一个正则表达式

"(X)+"

其中 X == 字符代码 3 转换为其 Unicode 等效项,搜索似乎永远不会起作用。如果我检查字符串的长度,它是正确的,并且 .* 返回字符串中的所有字符。但是我在构建正则表达式来搜索字符串时遇到了困难,因为我所要做的只是字符代码。有什么建议吗?

编辑:

var a = [0,1,2,3,0x111]; str = "";

for(var i = 0; i < a.length; i++) {
    str += String.fromCharCode(a[i]);
}

var r = [0x111]
var reg = ""

reg += "(";
for(var i = 0; i < r.length; i++) {
var hex = r[i].toString(16);
    reg += "\\x" + hex;
}
reg += ")";

var res = str.match(RegExp(reg))[0];

编辑

//Working code:
var a = [0,1,2,3,0x111];
str = "";

for(var i = 0; i < a.length; i++) {
    str += String.fromCharCode(a[i]);
}

var r = [3,0x111]
var reg = ""

reg += "(";
for(var i = 0; i < r.length; i++) {
    var hex = r[i].toString(16);
    reg += ((hex.length > 2) ? "\\u" : "\\x") + ("0000" + hex).slice((hex.length > 2) ? -4 : -2);
}
reg += ")";

var res = str.match(RegExp(reg))[0];
4

1 回答 1

2

通过对一些细节的更改,该示例可以工作。

假设您一般对可打印的 Unicode 字符感兴趣,而不是前四个控制字符,a则字符串“hello”的测试向量将是:

var a = [104, 101, 108, 108, 111]; // hello

如果要匹配两个 'l' 字符:

var r = [108, 108]

构造正则表达式时,字符代码必须为十六进制:

reg += "\\x" + ("0" + r[i].toString(16)).slice(-2);

之后,您应该会看到预期的结果。

于 2014-05-11T05:51:23.260 回答