8

我正在研究串行端口,以 8 位数据向某些硬件发送和接收数据。我想将其存储为字符串以方便比较,预设数据以字符串或十六进制格式存储在xml文件中。我发现只有在使用 Encoding.Default (即 ANSI 编码)时,8 位数据才能正确转换且易于可逆。ASCII 编码只适用于 7 位数据,而 UTF8 或 UTF7 也不能很好地工作,因为我使用的是 1-255 中的一些字符。Encoding.Default 会很好,但我在 MSDN 上读到它取决于操作系统代码页设置,这意味着它在配置的不同代码页上可能表现不同。我使用编码广泛使用 GetBytes() 和 GetString,但希望有一种故障安全且可移植的方法,该方法在任何配置下始终有效。

4

5 回答 5

19

Latin-1 aka ISO-8859-1 aka codepage 28591 是此场景的有用代码页,因为它映射 128-255 范围内的值不变。以下是可以互换的:

Encoding.GetEncoding(28591)
Encoding.GetEncoding("Latin1")
Encoding.GetEncoding("iso-8859-1")

以下代码说明了这样一个事实,即对于 Latin1,与 Encoding.Default 不同,0-255 范围内的所有字符都被映射为不变:

static void Main(string[] args)
{

    Console.WriteLine("Test Default Encoding returned {0}", TestEncoding(Encoding.Default));
    Console.WriteLine("Test Latin1 Encoding returned {0}", TestEncoding(Encoding.GetEncoding("Latin1")));
    Console.ReadLine();
    return;
}

private static bool CompareBytes(char[] chars, byte[] bytes)
{
    bool result = true;
    if (chars.Length != bytes.Length)
    {
        Console.WriteLine("Length mismatch {0} bytes and {1} chars" + bytes.Length, chars.Length);
        return false;
    }
    for (int i = 0; i < chars.Length; i++)
    {
        int charValue = (int)chars[i];
        if (charValue != (int)bytes[i])
        {
            Console.WriteLine("Byte at index {0} value {1:X4} does not match char {2:X4}", i, (int) bytes[i], charValue);
            result = false;
        }
    }
    return result;
}
private static bool TestEncoding(Encoding encoding)
{
    byte[] inputBytes = new byte[256];
    for (int i = 0; i < 256; i++)
    {
        inputBytes[i] = (byte) i;
    }

    char[] outputChars = encoding.GetChars(inputBytes);
    Console.WriteLine("Comparing input bytes and output chars");
    if (!CompareBytes(outputChars, inputBytes)) return false;

    byte[] outputBytes = encoding.GetBytes(outputChars);
    Console.WriteLine("Comparing output bytes and output chars");
    if (!CompareBytes(outputChars, outputBytes)) return false;

    return true;
}
于 2008-09-21T17:56:18.370 回答
9

为什么不直接使用字节数组呢?它不会有您在使用文本方法时可能遇到的任何编码问题。

于 2008-09-21T17:23:53.050 回答
2

我认为您应该改用字节数组。为了比较,您可以使用如下方法:

static bool CompareRange(byte[] a, byte[] b, int index, int count)
{
    bool res = true;
    for(int i = index; i < index + count; i++)
    {
        res &= a[i] == b[i];
    }
    return res;
}
于 2008-09-21T17:51:49.783 回答
1

使用适用于 Windows-1255 的希伯来语代码页。它的 8 位。
编码 enc = Encoding.GetEncoding("windows-1255");

当您写“1-255”时,我误会了您,以为您在哪里引用代码页 1255 中的字符。

于 2008-09-21T17:44:13.157 回答
-2

您可以使用 base64 编码将字节转换为字符串并返回。这样代码页或奇怪的字符没有问题,而且它比十六进制更节省空间。

byte[] toEncode; 
string encoded = System.Convert.ToBase64String(toEncode);
于 2008-09-21T17:37:36.650 回答