我有一个用 C 编写的 LZW 压缩器/解压缩器。
初始表由 ASCII 字符组成,然后每个现在要保存到表中的字符串由一个前缀和一个字符组成,两者都保存在一个列表中作为 int。
我的压缩有效,但我的解压缩留下了一些字符。
输入:
<title>Agile</title><body><h1>Agile</h1></body></html>
我得到的输出(注意缺少'e'和'<'):
<title>Agile</title><body><h1>Agil</h1></body>/html>
这是我使用的代码(相关部分):
void expand(int * input, int inputSize) {    
    // int prevcode, currcode
    int previousCode; int currentCode;
    int nextCode = 256; // start with the same dictionary of 255 characters
    dictionaryInit();
    // prevcode = read in a code
    previousCode = input[0];
    int pointer = 1;
    // while (there is still data to read)
    while (pointer < inputSize) {
        // currcode = read in a code
        currentCode = input[pointer++];
        if (currentCode >= nextCode) printf("!"); // XXX not yet implemented!
        currentCode = decode(currentCode);
        // add a new code to the string table
        dictionaryAdd(previousCode, currentCode, nextCode++);
        // prevcode = currcode
        previousCode = currentCode;
    }
}
int decode(int code) {
    int character; int temp;
    if (code > 255) { // decode
        character = dictionaryCharacter(code);
        temp = decode(dictionaryPrefix(code)); // recursion
    } else {
        character = code; // ASCII
        temp = code;
    }
    appendCharacter(character); // save to output
    return temp;
}
你能发现吗?我将不胜感激。