char
和byte
类型之间存在微妙(但非常重要)的区别。考虑一下:
class Krypte {
public static void main (String [] args) {
int i = 12345;
String k = Integer.toString(i);
System.out.println("Before: " + k);
String G = secure(k.toCharArray());
System.out.println("Encrypted: " + G);
String U = secure(G.toCharArray());
System.out.println("Decrypted: " + U);
int X = Integer.parseInt(U);
System.out.println("As an int: " + X);
}
public static String secure(char[] msg) {
// Variables
int outLength = msg.length;
byte secret = (byte) 0xAC; // same as 10101100b (Key)
// XOR kryptering
for (int i = 0; i < outLength; i++) {
// encrypting each byte with XOR (^)
System.out.println("Byte before: " + msg[i]);
msg[i] = (char) (msg[i] ^ secret);
System.out.println("Byte after: " + msg[i]);
}
return new String(msg);
}
}
这行得通(证明),因为用一个字节对某些字符值进行异或(很可能)会给你一个有效的字符。
不要让我们看看原始代码段中发生了什么- 通过将此调试输出添加到方法的主循环中secure
:
System.out.println("Byte before: " + msg[i]);
msg[i] = (byte) (msg[i] ^ secret);
System.out.println("Byte after: " + msg[i]);
输出将是:
Byte before: 49
Byte after: -99
Byte before: 50
Byte after: -98
Byte before: 51
Byte after: -97
Byte before: 52
Byte after: -104
Byte before: 53
Byte after: -103
没关系:第一个getBytes
函数使用平台的默认 charset将给定的字符串编码为字节数组。字符被编码为字节值;变成等'1'
49
'2'
50
然后我们用我们的键对这些值进行异或运算 - 并得到这个字节序列:
-99 -98 -97 -104 -103
最后一步似乎很简单:我们只是从这个字节序列中创建(并返回)一个新的字符串,这里会出现什么问题?但事实上,这正是风扇受到打击的那一步。)
看,String
构造函数尝试使用平台的默认字符集来处理这个字节序列。实际上,对于某些字符集,这些字节代表一系列有效字符就可以了——但对于 UTF-8 则不行!
...您可能已经猜到接下来会发生什么。对于每个“不可解码”的字节序列,如此处所述,第一个字节被转换为所谓的替换字符,并重试其他字节。secure
在此特定示例中,第一次调用返回的字符串中将有五个失败迹象。
解码这个字符串是毫无意义的——因为它不存储关于目标字符串的任何信息(长度除外)。这就是原始代码最终失败的原因。