问题标签 [hunspell]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dictionary - 如何对缩写进行拼写检查?
我正在使用基于 MySpell 的Hunspell ,但我不知道如何对中间带有撇号的单词进行拼写检查。
根据以下示例,我正在 Max OS X Terminal 的命令行上对其进行测试:
这个短语有单引号和一个撇号(全部使用 ASCII 0x27 '
)
我正在保存这个文件,test.txt
然后hunspell
按如下方式运行程序以显示拼写错误:
这打印"doesn"
为拼写失败。所有其他单词都通过了,包括砍掉的"t"
。
这个词doesn't
在我的字典里。(从 Mozilla 下载)
我可以通过添加到词缀文件(en-GB.aff)来强制字典不拆分单词,WORDCHARS '
但是引用的单词会被认为拼写错误,所以我得到:
有没有办法(无需预处理文本)来匹配有效的缩写和 decapse 引用?
python - 在 Windows 上构建 pyhunspell
我在使用 64 位 Python 2.7 的 Windows 上
我下载了 hunspell和pyhunspell。
使用 64 位 MinGW 系统,我成功编译了 hunspell 项目 - 生成了可执行的 hunspell 工具和 hunspell 库。构建后这是我的文件夹结构:
在文件夹hunspell-0.1
中我有 pyhunspell 项目。我打开setup.py
文件并像这样更改它:
执行python setup.py build -c mingw32
结果如下:构建日志以错误消息结尾:
c:/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/4.8.2/../../../../x86_64-w64-mingw32/bin/ld.exe: c:/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/4.8.2/../../../../x86_64-w64-mingw32/lib/../lib/libmingw32.a(lib64_libmingw32_a-mingw_helpers.o): bad reloc address 0x0 in section ".pdata"'
任何想法可能是什么问题?
c# - Hunspell 积分错误
我一直在尝试将 NHunspell 拼写检查 API 集成到我目前正在处理的统一项目中。我已经能够使用代码正确设置它:
但是当我按下播放时,我收到以下错误:
这些文件是从 Nhunspell 网站下载的,并且位于正确的目录位置:
我知道该错误是由于它认为 aff 文件为空而导致的,但事实并非如此。我无法在网上找到任何有同样问题的人,使用 NHunspell 的其他示例似乎使用相同的代码没有任何问题。无论我将文件放在目录中的何处,都会发生相同的错误。
如果有人可以帮助我,将不胜感激。
emacs - OS X 10.9 上的 hunspell / emacs
我无法构建 aspell,所以我正在尝试 hunspell。建立了hunspell。设置 .emacs 以便 emacs 可以(并且确实)找到可执行文件,如下所示:
这在我的 .bash_profile
也试过
(有一个目录 ~/Applications/en_US 存放字典文件)
但是 ispell-buffer 返回类似
hunspell 找不到字典吗?有什么特别的地方应该放字典吗?或者我如何告诉 emacs/hunspell 在哪里查找字典?
nlp - Hunspell 词缀条件正则表达式格式。有什么方法可以匹配开始吗?
再会。
我正在尝试在我的应用程序中使用 Hunspell 作为词干分析器。我不太喜欢搬运工和雪球词干,因为它们的“切碎”词结果如“abus”、“exampl”。Lemmatizing 似乎是一个不错的选择,但我不知道任何好的 CoreNLP 替代方案,而且我当然还没有准备好将我的项目的源代码移植到 Java 或使用桥接器。理想情况下,我希望看到给定单词的初始形式,类似于字典中的形式。
正如我注意到的那样,大多数字典在 .dic 文件中都有单独的单词:bid and biding,set and setting,get and getting等等。我在 Hunspell 方面没有那么有经验,但没有任何聪明的方法可以处理 3 个字母单词的双 d 或 t?有没有办法让它认为“设置”实际上是从“设置”派生的?
我目前对 Hunspell 的特殊问题是我无法获得用于创建/编辑附加文件的良好综合文档。这就是文档所说的:http: //manpages.ubuntu.com/manpages/dapper/man4/hunspell.4.html
默认是这样的:
我试过这个:
但它显然也会匹配 asSET。有什么办法可以绕过它吗?我在正则表达式的开头尝试了 ^ 符号,但它似乎不起作用。我该怎么做才能让它发挥作用?
提前致谢。
php - 如何强制附魔在 php 中使用 Hunspell
有没有办法强制 php 的附魔模块使用特定的拼写检查引擎?
我安装了 aspell、myspell、hunspell 等库。请求字典时,似乎我只能指定一个语言标签,如“en_US”等,而无法真正控制在检查时使用哪个底层实现。有没有一种方法可以强制附魔在拼写检查时优先使用 hunspell(或任何其他首选/支持的引擎)。
ruby-on-rails - solr - 太阳黑子:重新编制索引时出错(Errno::ECONNREFUSED:连接被拒绝)
世界。我是新来的。我有问题:
在我使用类进行蒸汽之后
在“schema.xml”中
我重新启动 solr-server,然后无法重新索引 (rake sunspot:reindex)。得到这个错误:
如果我从 schema.xml 中删除 hunspell,则重新索引已完成。utf-8 中的 ru_RU.dic 和 ru_RU.aff。
先感谢您)
vb.net - VB.NET - 拼写检查错误 (NHunspell)
基本上我使用NHunspell来检查拼写错误,我遇到了一个错误和问题。
错误在于,每当将 NHunspell 添加到文本框或富文本框时,它根本无法停靠到容器或在停靠时调整大小。它崩溃了。为了避免这个错误,我必须简单地锁定表单并禁用最大化按钮。这样用户就可以关闭程序并调整其大小。
错误:
另一个问题是似乎存在性能问题。如果我要加载一个包含大约 500 多个字符的文件并且有相当多的错误,比如说 25,我尝试向下滚动页面,它会变得非常滞后。
我知道这很多,但我想知道是否有人一直在使用它找到解决方案,如果有人可以帮助我,那就太好了!
PS。仅当我使用 RichTextBoxes 时才会出现此问题。文本框很好。
c# - NuGet 上的 NHunspell 包未引用并且无法在 Xamarin Studio 上使用
所以我对编程有点陌生,但我开始使用 Xamarin,我尝试在 Xamarin Studio 上从 NuGet 添加 NHunspell 包,它下载它并且 .dll 出现在 Resources 中,NHunspell 出现在 Packets 中,但它没有出现在参考资料,所以当我尝试“使用 NHunspell”时它不起作用。我曾尝试使用 Power Shell 运行“安装”脚本,但显然没有任何改变。
如何将 NHunspell 添加到我的项目中?
solr - 如何在 Hunspell 中指示词干词干异常
我正在使用 Hunspell 为 SOLR 实例提取词干。在大多数情况下,它似乎运作良好。
我正在使用 OpenOffice dic/aff 文件。
但是,有一些值得注意的词例外,我希望能够将这些作为词干的候选者删除。
一个很好的例子是“skier”,它源于“sky”,原因如下:
有什么方法可以表明这一点,skier
并且只skier
应该不理会吗?