4

我有两个来自 Google Chrome 拼写检查器(基于 hunspell)的 BDIC(二进制字典?)文件。我想将这两个文件合并到一个 BDIC 中,用于所有单词。

这是来自 Chrome 源 (LGPL/C++) 的这种格式的读取器/写入器(chromium/src/third_party/hunspell/google/bdict_reader.h)

如何将两个文件与 C++ 或命令行实用程序结合起来?

4

1 回答 1

6

合并两个 hunspell 词典很容易,有像https://github.com/arty-name/hunspell-merge这样的工具可以帮助您将任意数量的源词典合并在一起。

创建bdictChrome 可以理解的文件比较棘手。Chrome 使用这种格式进行优化,并在内部使用工具convert_dict将文件转换为. 我在网上找不到这个工具,所以它只剩下一个选择,从 Chromium 源构建它。谷歌有一个非常简单的设置,如果仔细执行,你可以构建这个工具。首先,您必须按照http://dev.chromium.org/developers/how-tos/get-the-code获取代码并根据您的平台设置环境。之后执行,如果完成没有错误,在文件夹下找到您的可执行文件。affdicbdictninja -C out\Debug convert_dictconvert_dictout/Debug

您无法向 Chrome 添加自定义语言(据我所知),因此您必须替换其中一种预定义语言。我建议安装一种您不理解的语言并将其用于合并的语言。这些bdict文件可以在 Chrome 用户配置文件文件夹中找到。

于 2015-03-25T16:28:08.993 回答