我有一个 LZW 算法 -
private void start(int maxNumBits) throws IOException{
System.out.println("Beginning");
/** Compress a string to a list of output symbols. */
// Build the dictionary.
for (int i = 0; i < 256; i++)
dict.put("" + (char)i, i);
int i;
String w = "";
int bitsRead = 0;
int bitsOutput = 0;
int trieLength = 0;
float lastCr = 0f;
while((i = reader.read()) != EOF){
bitsRead += 8;
float currentCr = (float)bitsRead / (float)bitsOutput;
if(bytesRead % 1024 == 0)
System.out.println(currentCr);
String wi = w + (char)i;
if (dict.containsKey(wi) && ((currentCr >= lastCr) || (trieLength < maxNumBits))){
w = wi;
trieLength += 8;
}
else {
fos.write(dict.get(w));
bitsOutput += 8;
// Add wi to the dictionary.
dict.put(wi, mapSize++);
w = "" + (char)i;
trieLength = 0;
}
lastCr = currentCr;
}
// Output the code for w.
if (!w.equals("")){
fos.write(dict.get(w));
bitsOutput += 8;
}
}
wheremaxNumBits
应该是 trie 的最大大小。maxNumBits
假设异常在传递参数的主类中被捕获。假设dict
是 a HashMap
,reader
是 aFileInputStream
并且fos
是 a FileOutputStream
。
在我的版本中,如果 trie 变满(即trieLength > maxNumBits
),则继续压缩,直到当前压缩率(currentCr
)小于上一个压缩率(lastCr
)。
我已经在一个 ~8mb 文件上运行了它,并且更改 trie 长度对累积压缩率没有任何影响。这是代码吗
if(dict.containsKey(wi) && ((currentCr >= lastCr)||(trieLength < maxNumBits)))
是否符合所描述的要求?
谢谢你的帮助,
山姆
编辑 - 感谢您在格式化方面的帮助,爱德华