问题标签 [hunspell]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 基于词频的最大编辑距离和建议
我需要一个具有以下规范的拼写检查器:
- 非常可扩展。
- 能够为建议的单词设置最大编辑距离。
- 根据提供的单词频率(最常见的单词优先)获得建议。
我看了一下 Hunspell:
我在 man 中找到了参数 MAXDIFF,但似乎没有按预期工作。也许我以错误的方式使用它
文件t.aff:
文件dico.dic:
-
返回相同的东西t.aff
是否为空:
google-chrome - 将 Chrome (hunspell) 中的两个 BDIC 文件合并为一个
我有两个来自 Google Chrome 拼写检查器(基于 hunspell)的 BDIC(二进制字典?)文件。我想将这两个文件合并到一个 BDIC 中,用于所有单词。
这是来自 Chrome 源 (LGPL/C++) 的这种格式的读取器/写入器(chromium/src/third_party/hunspell/google/bdict_reader.h)
如何将两个文件与 C++ 或命令行实用程序结合起来?
ruby-on-rails - 在 Heroku 中使用 Hunspell
我正在构建一个使用 Hunspell 和 hunspell-ffi gem 的 Rails 应用程序,以便 Ruby 可以与之交互。我正在将应用程序部署到 heroku,但不幸的是,它需要在服务器上安装 Hunspell 才能使 gem 工作。
我有什么办法可以在 Heroku 上安装 Hunspell?还是我必须迁移到 EC2?
提前致谢 :)
dictionary - 如何为 Hunspell 制作自定义词典
我有一个关于为 hunspell 构建自定义词典的问题。我现在正在使用通用英语词典和词缀文件。如何为我的每个用户将用户指定的单词添加到该词典中?
emacs - 带有 hunspell 的 Win32 上的 Emacs - 个人字典无法保存
因此,在按照 wiki 中的说明进行操作后,我使用 hunspell 在 Windows 7 上为 Emacs (v23.3.1) 进行了工作设置。
http://www.emacswiki.org/emacs/InteractiveSpell
当我对文档进行拼写检查 ( M-x ispell
) 时,emacs 为我提供了使用击键'i'
或'u'
. 最后,它询问我是否要保存修改后的个人词典,我选择是。
问题是个人词典没有保存到磁盘,并且之前突出显示的单词在新会话中再次被标记。
尝试了其他地方推荐的以下方法无济于事:
(setq ispell-personal-dictionary (expand-file-name "~/personal-dictionary.txt") )
有人对此有解决方案或解决方法吗?如果您能够保存到个人字典,请张贴您的相关位.emacs
.net - NHunspell 与 Microsoft Word?
有谁知道是否有办法将NHunspell与 Microsoft Word 集成?
我一直在尝试找到一种将开源拼写词典与 Microsoft Word 一起使用的方法,以支持目前没有直接从 Microsoft 进行拼写检查选项的语言。但是一直没能找到任何解决办法。
我专门与 Khmer 合作(我是Hunspell的 Khmer 拼写检查字典的作者之一),许多人不使用 Khmer 拼写检查的原因之一是它缺乏对 Microsoft Word 的支持。已经尝试过 Microsoft Word 集成(PAN Cambodia有一个 Word 拼写检查插件,但速度太慢且不准确,基本上无法使用。
更新:我们能够使用 NHunspell 为 Khmer 和 Microsoft Word 创建拼写检查器。你可以在这里下载它以及源代码(你可以 fork 为另一种语言)。
bash - 使用 awk 进行条件查找/替换
我想解决一个常见但非常具体的问题:由于 OCR 错误,许多字幕文件包含字符“I”(大写 i)而不是“l”(小写 L)。
我的进攻计划是:
- 逐字处理文件
- 将每个单词传递给 hunspell 拼写检查器(“echo the-word | hunspell -l”如果有效则根本不产生响应,如果不正确则产生响应)
- 如果它是一个坏词,并且其中包含大写字母 Is,则将其替换为小写字母 l 并重试。如果它现在是一个有效的词,则替换原来的词。
我当然可以在脚本中标记和重建整个文件,但是在我走这条路之前,我想知道是否可以在单词级别使用 awk 和/或 sed 进行这些类型的条件操作?
任何其他建议的方法也将非常受欢迎!
dictionary - 开放拼写检查器的字典文件结构
是否有任何关于 FreeDict、Aspell、Hunspell/OpenOffice 词典的文件结构的解释文档或教程,尤其是关于每个文件中每一行末尾的开关.dic
?我的猜测是开关描述了这个词的语义解释,无论它是
- 名词
- 形容词
- 副词
- 状语
- 等等
或以上任意组合。但我不知道如何将这些与开关字符相匹配。
我也很好奇.aff
文件描述的内容。
c++ - Hunspell:有什么可靠的例子吗?
我已经下载并编译了 hunspell 很好。现在我想在 wxWidgets 上制作一个测试应用程序,我开始寻找示例或教程。到目前为止,我还没有找到。我可以找到“示例”可执行文件,但没有代码(可能隐藏在某个找不到的地方?)。在整个互联网上三天我什么也没找到。我发现的最好的是这是我无法理解的语言。
我会欣赏任何简单的例子,指向教程的指针或任何有价值的东西。非常感谢!
java - 如何结合 Lucene 和 Hunspell 在 PDF 文档中进行搜索?
我正在尝试将 hunspell 实施到 lucene 中。任务是制作一个在 pdf 文档中查找单词的应用程序。我知道我必须做一般但不具体的事情。我知道我必须制作一个包含文档单词根的索引的列表,然后在该列表中搜索。
但是:我是一个java初学者,所以我真的不知道如何开始。每个建议都会有所帮助。