6

我目前正在使用 C# 开发一个使用Amazon SQS的应用程序 消息的大小限制为 8kb。

我有一个类似的方法:

public void QueueMessage(string message)

在这个方法中,我想首先压缩消息(大多数消息是作为 json 传递的,所以已经相当小了)

如果压缩后的字符串仍然大于 8kb,我会将其存储在 S3 中。

我的问题是:

如何轻松测试字符串的大小,以及压缩它的最佳方法是什么?我不是在寻找尺寸的大幅减小,只是一些简单易用的东西 - 并且易于在另一端解压缩。

4

2 回答 2

12

要知道字符串的“大小”(以 kb 为单位),我们需要知道编码。如果我们假设 UTF8,那么它(不包括 BOM 等)如下所示(但如果不是 UTF8,则交换编码):

int len = Encoding.UTF8.GetByteCount(longString);

重新包装;我建议通过 UTF8 进行 GZIP,如果必须是字符串,可以选择后跟 base-64:

    using (MemoryStream ms = new MemoryStream())
    {
        using (GZipStream gzip = new GZipStream(ms, CompressionMode.Compress, true))
        {
            byte[] raw = Encoding.UTF8.GetBytes(longString);
            gzip.Write(raw, 0, raw.Length);
            gzip.Close();
        }
        byte[] zipped = ms.ToArray(); // as a BLOB
        string base64 = Convert.ToBase64String(zipped); // as a string
        // store zipped or base64
    }
于 2010-05-04T11:31:15.777 回答
1

给这个函数解压缩字节。我能想到的最好的就是

public static byte[] ZipToUnzipBytes(byte[] bytesContext)
        {
            byte[] arrUnZipFile = null;
            if (bytesContext.Length > 100)
            {
                using (var inFile = new MemoryStream(bytesContext))
                {
                    using (var decompress = new GZipStream(inFile, CompressionMode.Decompress, false))
                    {
                        byte[] bufferWrite = new byte[4];
                        inFile.Position = (int)inFile.Length - 4;
                        inFile.Read(bufferWrite, 0, 4);
                        inFile.Position = 0;
                        arrUnZipFile = new byte[BitConverter.ToInt32(bufferWrite, 0) + 100];
                        decompress.Read(arrUnZipFile, 0, arrUnZipFile.Length);
                    }
                }
            }
            return arrUnZipFile;
        }
于 2012-04-13T13:30:16.130 回答