6

我正在编写一个压缩程序,需要使用 c++ 将位数据写入二进制文件。如果有人可以就书面声明或提供建议的网站提供建议,我将不胜感激。

抱歉,如果这是一个简单或令人困惑的问题,我正在努力在网上找到答案。

4

3 回答 3

3

将位收集到整个字节中,例如 unsigned char 或 std::bitset(其中位集大小是 CHAR_BIT 的倍数),然后一次写入整个字节。计算机“处理比特”,但可用的抽象——尤其是 IO——是你作为程序员处理单个字节。按位操作可用于切换特定位,但您总是在处理字节大小的对象。

在输出的最后,如果你没有一个完整的字节,你需要决定应该如何存储它。iostreams 和 stdio 都可以分别使用 ostream::write 和 fwrite 写入未格式化的数据。

您可以考虑使用更大的块大小,例如 4-32 个或更多字符的数组或同等大小的位集,而不是单个字符或 bitset<8>(8 是 CHAR_BIT 的最常见值)。

于 2011-02-01T11:27:30.450 回答
2

对于编写二进制文件,我发现最有用的技巧是将所有二进制文件作为单个数组存储在内存中,然后将其全部移动到硬盘驱动器中。一次做一点,一次做一个字节,或者一次做一个无符号长长,不如将所有数据存储在一个数组中并使用一个“fwrite()”实例将其存储到硬盘。

size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream );

参考:http ://www.cplusplus.com/reference/clibrary/cstdio/fwrite/

用英语讲:

fwrite( [array* of stored data], [size in bytes of array OBJECT. For unsigned chars -> 1, for unsigned long longs -> 8], [number of instances in array], [FILE*])

始终检查您的退货以确认成功!

此外,可以提出一个论点,即使对象类型尽可能大是最快的方法([unsigned long long] > [char])。虽然我不精通“fwrite()”背后的编码,但我觉得将代码中使用的自然对象转换为 [unsigned long long] 的时间与“fwrite()”结合起来会花费更多时间“用你所拥有的来弥补。

回到我学习 Huffman Coding 的时候,我花了几个小时才意识到 [char] 和 [unsigned char] 之间是有区别的。请注意,对于这种方法,您应该始终使用无符号变量来存储纯二进制文件。

于 2011-12-30T09:07:53.080 回答
1

通过下面的课程,您可以一点一点地读写

class bitChar{
public:
    unsigned char* c;
    int shift_count;
    string BITS;

    bitChar()
    {
        shift_count = 0;
        c = (unsigned char*)calloc(1, sizeof(char));
    }

    string readByBits(ifstream& inf)
    {
        string s ="";
        char buffer[1];
        while (inf.read (buffer, 1))
        {
            s += getBits(*buffer);
        }
        return s;
    }

    void setBITS(string X)
    {
        BITS = X;
    }

    int insertBits(ofstream& outf)
    {
        int total = 0;

        while(BITS.length())
        {
            if(BITS[0] == '1')
                *c |= 1;
            *c <<= 1;
            ++shift_count;
            ++total;
            BITS.erase(0, 1);

            if(shift_count == 7 )
            {
                if(BITS.size()>0)
                {
                    if(BITS[0] == '1')
                        *c |= 1;
                    ++total;
                    BITS.erase(0, 1);
                }

                writeBits(outf);
                shift_count = 0;
                free(c);
                c = (unsigned char*)calloc(1, sizeof(char));
            }
        }

        if(shift_count > 0)
        {
            *c <<= (7 - shift_count);
            writeBits(outf);
            free(c);
            c = (unsigned char*)calloc(1, sizeof(char));
        }
        outf.close();
        return total;
    }

    string getBits(unsigned char X)
    {
        stringstream itoa;
        for(unsigned s = 7; s > 0 ; s--)
        {
            itoa << ((X >> s) & 1);
        }

        itoa << (X&1) ;
        return itoa.str();
    }

    void writeBits(ofstream& outf)
    {
        outf << *c;
    }

    ~bitChar()
    {
        if(c)
            free(c);
    }
};

为了example

#include <iostream>
#include <sstream>
#include <fstream>
#include <string> 
#include <stdlib.h>
using namespace std;


int main()
{
    ofstream outf("Sample.dat");
    ifstream inf("Sample.dat");

    string enCoded = "101000001010101010";

    //write to file
    cout << enCoded << endl ; //print  101000001010101010
    bitChar bchar;
    bchar.setBITS(enCoded);
    bchar.insertBits(outf);

     //read from file
    string decoded =bchar.readByBits(inf);
    cout << decoded << endl ; //print 101000001010101010000000
    return 0;
}
于 2013-12-31T10:34:56.747 回答