问题标签 [hunspell]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
313 浏览

dictionary - 如何对缩写进行拼写检查?

我正在使用基于 MySpell 的Hunspell ,但我不知道如何对中间带有撇号的单词进行拼写检查。

根据以下示例,我正在 Max OS X Terminal 的命令行上对其进行测试:

这个短语有单引号和一个撇号(全部使用 ASCII 0x27 '

我正在保存这个文件,test.txt然后hunspell按如下方式运行程序以显示拼写错误:

这打印"doesn"为拼写失败。所有其他单词都通过了,包括砍掉的"t"

这个词doesn't 我的字典里。(从 Mozilla 下载)

我可以通过添加到词缀文件(en-GB.aff)来强制字典不拆分单词,WORDCHARS '但是引用的单词会被认为拼写错误,所以我得到:

有没有办法(无需预处理文本)来匹配有效的缩写和 decapse 引用?

0 投票
1 回答
2040 浏览

python - 在 Windows 上构建 pyhunspell

我在使用 64 位 Python 2.7 的 Windows 上

我下载了 hunspellpyhunspell

使用 64 位 MinGW 系统,我成功编译了 hunspell 项目 - 生成了可执行的 hunspell 工具和 hunspell 库。构建后这是我的文件夹结构:

在文件夹hunspell-0.1中我有 pyhunspell 项目。我打开setup.py文件并像这样更改它:

执行python setup.py build -c mingw32结果如下:构建日志以错误消息结尾:

c:/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/4.8.2/../../../../x86_64-w64-mingw32/bin/ld.exe: c:/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/4.8.2/../../../../x86_64-w64-mingw32/lib/../lib/libmingw32.a(lib64_libmingw32_a-mingw_helpers.o): bad reloc address 0x0 in section ".pdata"'

任何想法可能是什么问题?

0 投票
0 回答
360 浏览

c# - Hunspell 积分错误

我一直在尝试将 NHunspell 拼写检查 API 集成到我目前正在处理的统一项目中。我已经能够使用代码正确设置它:

但是当我按下播放时,我收到以下错误:

NHunspell 统一错误

这些文件是从 Nhunspell 网站下载的,并且位于正确的目录位置:

AFF/DIC 文件位置

我知道该错误是由于它认为 aff 文件为空而导致的,但事实并非如此。我无法在网上找到任何有同样问题的人,使用 NHunspell 的其他示例似乎使用相同的代码没有任何问题。无论我将文件放在目录中的何处,都会发生相同的错误。

如果有人可以帮助我,将不胜感激。

0 投票
2 回答
2024 浏览

emacs - OS X 10.9 上的 hunspell / emacs

我无法构建 aspell,所以我正在尝试 hunspell。建立了hunspell。设置 .emacs 以便 emacs 可以(并且确实)找到可执行文件,如下所示:

这在我的 .bash_profile

也试过

(有一个目录 ~/Applications/en_US 存放字典文件)

但是 ispell-buffer 返回类似

hunspell 找不到字典吗?有什么特别的地方应该放字典吗?或者我如何告诉 emacs/hunspell 在哪里查找字典?

0 投票
1 回答
800 浏览

nlp - Hunspell 词缀条件正则表达式格式。有什么方法可以匹配开始吗?

再会。

我正在尝试在我的应用程序中使用 Hunspell 作为词干分析器。我不太喜欢搬运工和雪球词干,因为它们的“切碎”词结果如“abus”、“exampl”。Lemmatizing 似乎是一个不错的选择,但我不知道任何好的 CoreNLP 替代方案,而且我当然还没有准备好将我的项目的源代码移植到 Java 或使用桥接器。理想情况下,我希望看到给定单词的初始形式,类似于字典中的形式。

正如我注意到的那样,大多数字典在 .dic 文件中都有单独的单词:bid and biding,set and setting,get and getting等等。我在 Hunspell 方面没有那么有经验,但没有任何聪明的方法可以处理 3 个字母单词的双 d 或 t?有没有办法让它认为“设置”实际上是从“设置”派生的?

我目前对 Hunspell 的特殊问题是我无法获得用于创建/编辑附加文件的良好综合文档。这就是文档所说的:http: //manpages.ubuntu.com/manpages/dapper/man4/hunspell.4.html

默认是这样的:

我试过这个:

但它显然也会匹配 asSET。有什么办法可以绕过它吗?我在正则表达式的开头尝试了 ^ 符号,但它似乎不起作用。我该怎么做才能让它发挥作用?

提前致谢。

0 投票
1 回答
720 浏览

php - 如何强制附魔在 php 中使用 Hunspell

有没有办法强制 php 的附魔模块使用特定的拼写检查引擎?

我安装了 aspell、myspell、hunspell 等库。请求字典时,似乎我只能指定一个语言标签,如“en_US”等,而无法真正控制在检查时使用哪个底层实现。有没有一种方法可以强制附魔在拼写检查时优先使用 hunspell(或任何其他首选/支持的引擎)。

0 投票
0 回答
1011 浏览

ruby-on-rails - solr - 太阳黑子:重新编制索引时出错(Errno::ECONNREFUSED:连接被拒绝)

世界。我是新来的。我有问题:

在我使用类进行蒸汽之后

在“schema.xml”中

我重新启动 solr-server,然后无法重新索引 (rake sunspot:reindex)。得到这个错误:

如果我从 schema.xml 中删除 hunspell,则重新索引已完成。utf-8 中的 ru_RU.dic 和 ru_RU.aff。

先感谢您)

0 投票
1 回答
409 浏览

vb.net - VB.NET - 拼写检查错误 (NHunspell)

基本上我使用NHunspell来检查拼写错误,我遇到了一个错误和问题。

错误在于,每当将 NHunspell 添加到文本框或富文本框时,它根本无法停靠到容器或在停靠时调整大小。它崩溃了。为了避免这个错误,我必须简单地锁定表单并禁用最大化按钮。这样用户就可以关闭程序并调整其​​大小。

错误:

另一个问题是似乎存在性能问题。如果我要加载一个包含大约 500 多个字符的文件并且有相当多的错误,比如说 25,我尝试向下滚动页面,它会变得非常滞后。

我知道这很多,但我想知道是否有人一直在使用它找到解决方案,如果有人可以帮助我,那就太好了!

PS。仅当我使用 RichTextBoxes 时才会出现此问题。文本框很好。

0 投票
2 回答
260 浏览

c# - NuGet 上的 NHunspell 包未引用并且无法在 Xamarin Studio 上使用

所以我对编程有点陌生,但我开始使用 Xamarin,我尝试在 Xamarin Studio 上从 NuGet 添加 NHunspell 包,它下载它并且 .dll 出现在 Resources 中,NHunspell 出现在 Packets 中,但它没有出现在参考资料,所以当我尝试“使用 NHunspell”时它不起作用。我曾尝试使用 Power Shell 运行“安装”脚本,但显然没有任何改变。

如何将 NHunspell 添加到我的项目中?

0 投票
2 回答
662 浏览

solr - 如何在 Hunspell 中指示词干词干异常

我正在使用 Hunspell 为 SOLR 实例提取词干。在大多数情况下,它似乎运作良好。

我正在使用 OpenOffice dic/aff 文件。

但是,有一些值得注意的词例外,我希望能够将这些作为词干的候选者删除。

一个很好的例子是“skier”,它源于“sky”,原因如下:

有什么方法可以表明这一点,skier并且只skier应该不理会吗?