“hunspell”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

867 浏览

c# - 基于词频的最大编辑距离和建议

我需要一个具有以下规范的拼写检查器：

非常可扩展。
能够为建议的单词设置最大编辑距离。
根据提供的单词频率（最常见的单词优先）获得建议。

我看了一下 Hunspell：
我在 man 中找到了参数 MAXDIFF，但似乎没有按预期工作。也许我以错误的方式使用它

文件t.aff：

文件dico.dic：

-

返回相同的东西t.aff是否为空：

c#c++nlp spell-checking hunspell

2011-05-02T13:51:33.833

0 投票

1 回答

1977 浏览

google-chrome - 将 Chrome (hunspell) 中的两个 BDIC 文件合并为一个

我有两个来自 Google Chrome 拼写检查器（基于 hunspell）的 BDIC（二进制字典？）文件。我想将这两个文件合并到一个 BDIC 中，用于所有单词。

这是来自 Chrome 源 (LGPL/C++) 的这种格式的读取器/写入器(chromium/src/third_party/hunspell/google/bdict_reader.h)

如何将两个文件与 C++ 或命令行实用程序结合起来？

google-chrome dictionary hunspell

2011-07-30T08:55:04.367

0 投票

4 回答

1039 浏览

ruby-on-rails - 在 Heroku 中使用 Hunspell

我正在构建一个使用 Hunspell 和 hunspell-ffi gem 的 Rails 应用程序，以便 Ruby 可以与之交互。我正在将应用程序部署到 heroku，但不幸的是，它需要在服务器上安装 Hunspell 才能使 gem 工作。

我有什么办法可以在 Heroku 上安装 Hunspell？还是我必须迁移到 EC2？

提前致谢：）

ruby-on-rails heroku spell-checking hunspell

2011-08-14T19:43:17.277

0 投票

5 回答

18525 浏览

dictionary - 如何为 Hunspell 制作自定义词典

我有一个关于为 hunspell 构建自定义词典的问题。我现在正在使用通用英语词典和词缀文件。如何为我的每个用户将用户指定的单词添加到该词典中？

dictionary spell-checking hunspell

2011-09-26T21:38:10.583

0 投票

2 回答

1712 浏览

emacs - 带有 hunspell 的 Win32 上的 Emacs - 个人字典无法保存

因此，在按照 wiki 中的说明进行操作后，我使用 hunspell 在 Windows 7 上为 Emacs (v23.3.1) 进行了工作设置。

http://www.emacswiki.org/emacs/InteractiveSpell

当我对文档进行拼写检查 ( M-x ispell) 时，emacs 为我提供了使用击键'i'或'u'. 最后，它询问我是否要保存修改后的个人词典，我选择是。

问题是个人词典没有保存到磁盘，并且之前突出显示的单词在新会话中再次被标记。

尝试了其他地方推荐的以下方法无济于事：

(setq ispell-personal-dictionary (expand-file-name "~/personal-dictionary.txt") )

有人对此有解决方案或解决方法吗？如果您能够保存到个人字典，请张贴您的相关位.emacs

emacs emacs23 hunspell ispell emacsw32

2011-10-04T20:39:18.180

0 投票

1 回答

677 浏览

.net - NHunspell 与 Microsoft Word？

有谁知道是否有办法将NHunspell与 Microsoft Word 集成？

我一直在尝试找到一种将开源拼写词典与 Microsoft Word 一起使用的方法，以支持目前没有直接从 Microsoft 进行拼写检查选项的语言。但是一直没能找到任何解决办法。

我专门与 Khmer 合作（我是Hunspell的 Khmer 拼写检查字典的作者之一），许多人不使用 Khmer 拼写检查的原因之一是它缺乏对 Microsoft Word 的支持。已经尝试过 Microsoft Word 集成（PAN Cambodia有一个 Word 拼写检查插件，但速度太慢且不准确，基本上无法使用。

更新：我们能够使用 NHunspell 为 Khmer 和 Microsoft Word 创建拼写检查器。你可以在这里下载它以及源代码（你可以 fork 为另一种语言）。

.net ms-word hunspell

2011-10-11T19:17:49.777

0 投票

2 回答

475 浏览

bash - 使用 awk 进行条件查找/替换

我想解决一个常见但非常具体的问题：由于 OCR 错误，许多字幕文件包含字符“I”（大写 i）而不是“l”（小写 L）。

我的进攻计划是：

逐字处理文件
将每个单词传递给 hunspell 拼写检查器（“echo the-word | hunspell -l”如果有效则根本不产生响应，如果不正确则产生响应）
如果它是一个坏词，并且其中包含大写字母 Is，则将其替换为小写字母 l 并重试。如果它现在是一个有效的词，则替换原来的词。

我当然可以在脚本中标记和重建整个文件，但是在我走这条路之前，我想知道是否可以在单词级别使用 awk 和/或 sed 进行这些类型的条件操作？

任何其他建议的方法也将非常受欢迎！

bash sed awk hunspell spell-checking

2011-10-23T07:14:05.513

0 投票

3 回答

1165 浏览

dictionary - 开放拼写检查器的字典文件结构

是否有任何关于 FreeDict、Aspell、Hunspell/OpenOffice 词典的文件结构的解释文档或教程，尤其是关于每个文件中每一行末尾的开关.dic？我的猜测是开关描述了这个词的语义解释，无论它是

名词
形容词
副词
状语
等等

或以上任意组合。但我不知道如何将这些与开关字符相匹配。

我也很好奇.aff文件描述的内容。

dictionary spell-checking openoffice.org libreoffice hunspell

2011-10-24T20:59:30.493

0 投票

2 回答

3083 浏览

c++ - Hunspell：有什么可靠的例子吗？

我已经下载并编译了 hunspell 很好。现在我想在 wxWidgets 上制作一个测试应用程序，我开始寻找示例或教程。到目前为止，我还没有找到。我可以找到“示例”可执行文件，但没有代码（可能隐藏在某个找不到的地方？）。在整个互联网上三天我什么也没找到。我发现的最好的是这是我无法理解的语言。

我会欣赏任何简单的例子，指向教程的指针或任何有价值的东西。非常感谢！

c++wxwidgets hunspell

2011-11-30T13:45:53.007

0 投票

0 回答

515 浏览

java - 如何结合 Lucene 和 Hunspell 在 PDF 文档中进行搜索？

我正在尝试将 hunspell 实施到 lucene 中。任务是制作一个在 pdf 文档中查找单词的应用程序。我知道我必须做一般但不具体的事情。我知道我必须制作一个包含文档单词根的索引的列表，然后在该列表中搜索。

但是：我是一个java初学者，所以我真的不知道如何开始。每个建议都会有所帮助。

java dictionary lucene information-retrieval hunspell

2011-12-04T00:31:33.630

问题标签 [hunspell]

Reference