2

可能的重复将字节数组转换为字符串并在 C# 中再次返回

我正在使用霍夫曼编码从这里压缩和解压缩一些文本

那里的代码构建了一个霍夫曼树来使用它进行编码和解码。当我直接使用代码时一切正常。

对于我的情况,我需要获取压缩内容,将其存储并在需要时解压缩。

编码器的输出和解码器的输入是BitArray

当我尝试将其转换BitArrayStringBitArray使用以下代码对其进行解码时,我得到了一个奇怪的答案。

Tree huffmanTree = new Tree();
huffmanTree.Build(input);

string input = Console.ReadLine();
BitArray encoded = huffmanTree.Encode(input);

// Print the bits
Console.Write("Encoded Bits: ");
foreach (bool bit in encoded)
{
    Console.Write((bit ? 1 : 0) + "");
}
Console.WriteLine();

// Convert the bit array to bytes
Byte[] e = new Byte[(encoded.Length / 8 + (encoded.Length % 8 == 0 ? 0 : 1))];
encoded.CopyTo(e, 0);

// Convert the bytes to string
string output = Encoding.UTF8.GetString(e);

// Convert string back to bytes
e = new Byte[d.Length];
e = Encoding.UTF8.GetBytes(d);

// Convert bytes back to bit array
BitArray todecode = new BitArray(e);

string decoded = huffmanTree.Decode(todecode);

Console.WriteLine("Decoded: " + decoded);

Console.ReadLine();

本教程的原始代码输出为:

在此处输入图像描述

我的代码的输出是:

在此处输入图像描述

我哪里错了朋友?帮助我,提前谢谢。

4

2 回答 2

4

您不能将任意字节填充到字符串中。这个概念只是未定义。使用编码进行转换。

string output = Encoding.UTF8.GetString(e);

e此时只是二进制垃圾,它不是UTF8 字符串。所以在它上面调用 UTF8 方法是没有意义的。

解决方案:不要转换和反向转换到/从字符串。这不是往返。你为什么首先这样做?如果您需要字符串,请使用可往返的格式,例如 base-64 或 base-85。

于 2013-02-03T10:00:18.190 回答
0

我很确定 Encoding 不会往返 - 也就是说,您不能将任意字节序列编码为字符串,然后使用相同的 Encoding 来获取字节并始终期望它们是相同的。

如果您希望能够从原始字节到字符串并返回到相同的原始字节,则需要使用 base64 编码,例如

http://blogs.microsoft.co.il/blogs/mneiter/archive/2009/03/22/how-to-encoding-and-decoding-base64-strings-in-c.aspx

于 2013-02-03T09:24:31.277 回答