问题标签 [hunspell]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
867 浏览

c# - 基于词频的最大编辑距离和建议

我需要一个具有以下规范的拼写检查器:

  • 非常可扩展。
  • 能够为建议的单词设置最大编辑距离。
  • 根据提供的单词频率(最常见的单词优先)获得建议。

我看了一下 Hunspell:
我在 man 中找到了参数 MAXDIFF,但似乎没有按预期工作。也许我以错误的方式使用它

文件t.aff

文件dico.dic

-

返回相同的东西t.aff是否为空:

0 投票
1 回答
1977 浏览

google-chrome - 将 Chrome (hunspell) 中的两个 BDIC 文件合并为一个

我有两个来自 Google Chrome 拼写检查器(基于 hunspell)的 BDIC(二进制字典?)文件。我想将这两个文件合并到一个 BDIC 中,用于所有单词。

这是来自 Chrome 源 (LGPL/C++) 的这种格式的读取器/写入器(chromium/src/third_party/hunspell/google/bdict_reader.h)

如何将两个文件与 C++ 或命令行实用程序结合起来?

0 投票
4 回答
1039 浏览

ruby-on-rails - 在 Heroku 中使用 Hunspell

我正在构建一个使用 Hunspell 和 hunspell-ffi gem 的 Rails 应用程序,以便 Ruby 可以与之交互。我正在将应用程序部署到 heroku,但不幸的是,它需要在服务器上安装 Hunspell 才能使 gem 工作。

我有什么办法可以在 Heroku 上安装 Hunspell?还是我必须迁移到 EC2?

提前致谢 :)

0 投票
5 回答
18525 浏览

dictionary - 如何为 Hunspell 制作自定义词典

我有一个关于为 hunspell 构建自定义词典的问题。我现在正在使用通用英语词典和词缀文件。如何为我的每个用户将用户指定的单词添加到该词典中?

0 投票
2 回答
1712 浏览

emacs - 带有 hunspell 的 Win32 上的 Emacs - 个人字典无法保存

因此,在按照 wiki 中的说明进行操作后,我使用 hunspell 在 Windows 7 上为 Emacs (v23.3.1) 进行了工作设置。

http://www.emacswiki.org/emacs/InteractiveSpell

当我对文档进行拼写检查 ( M-x ispell) 时,emacs 为我提供了使用击键'i''u'. 最后,它询问我是否要保存修改后的个人词典,我选择是。

问题是个人词典没有保存到磁盘,并且之前突出显示的单词在新会话中再次被标记。

尝试了其他地方推荐的以下方法无济于事:

(setq ispell-personal-dictionary (expand-file-name "~/personal-dictionary.txt") )

有人对此有解决方案或解决方法吗?如果您能够保存到个人字典,请张贴您的相关位.emacs

0 投票
1 回答
677 浏览

.net - NHunspell 与 Microsoft Word?

有谁知道是否有办法将NHunspell与 Microsoft Word 集成?

我一直在尝试找到一种将开源拼写词典与 Microsoft Word 一起使用的方法,以支持目前没有直接从 Microsoft 进行拼写检查选项的语言。但是一直没能找到任何解决办法。

我专门与 Khmer 合作(我是Hunspell的 Khmer 拼写检查字典的作者之一),许多人不使用 Khmer 拼写检查的原因之一是它缺乏对 Microsoft Word 的支持。已经尝试过 Microsoft Word 集成(PAN Cambodia有一个 Word 拼写检查插件,但速度太慢且不准确,基本上无法使用。

更新:我们能够使用 NHunspell 为 Khmer 和 Microsoft Word 创建拼写检查器。你可以在这里下载它以及源代码(你可以 fork 为另一种语言)。

0 投票
2 回答
475 浏览

bash - 使用 awk 进行条件查找/替换

我想解决一个常见但非常具体的问题:由于 OCR 错误,许多字幕文件包含字符“I”(大写 i)而不是“l”(小写 L)。

我的进攻计划是:

  1. 逐字处理文件
  2. 将每个单词传递给 hunspell 拼写检查器(“echo the-word | hunspell -l”如果有效则根本不产生响应,如果不正确则产生响应)
  3. 如果它是一个坏词,并且其中包含大写字母 Is,则将其替换为小写字母 l 并重试。如果它现在是一个有效的词,则替换原来的词。

我当然可以在脚本中标记和重建整个文件,但是在我走这条路之前,我想知道是否可以在单词级别使用 awk 和/或 sed 进行这些类型的条件操作?

任何其他建议的方法也将非常受欢迎!

0 投票
3 回答
1165 浏览

dictionary - 开放拼写检查器的字典文件结构

是否有任何关于 FreeDict、Aspell、Hunspell/OpenOffice 词典的文件结构的解释文档或教程,尤其是关于每个文件中每一行末尾的开关.dic?我的猜测是开关描述了这个词的语义解释,无论它是

  • 名词
  • 形容词
  • 副词
  • 状语
  • 等等

或以上任意组合。但我不知道如何将这些与开关字符相匹配。

我也很好奇.aff文件描述的内容。

0 投票
2 回答
3083 浏览

c++ - Hunspell:有什么可靠的例子吗?

我已经下载并编译了 hunspell 很好。现在我想在 wxWidgets 上制作一个测试应用程序,我开始寻找示例或教程。到目前为止,我还没有找到。我可以找到“示例”可执行文件,但没有代码(可能隐藏在某个找不到的地方?)。在整个互联网上三天我什么也没找到。我发现的最好的是这是我无法理解的语言。

我会欣赏任何简单的例子,指向教程的指针或任何有价值的东西。非常感谢!

0 投票
0 回答
515 浏览

java - 如何结合 Lucene 和 Hunspell 在 PDF 文档中进行搜索?

我正在尝试将 hunspell 实施到 lucene 中。任务是制作一个在 pdf 文档中查找单词的应用程序。我知道我必须做一般但不具体的事情。我知道我必须制作一个包含文档单词根的索引的列表,然后在该列表中搜索。

但是:我是一个java初学者,所以我真的不知道如何开始。每个建议都会有所帮助。