问题标签 [hunspell]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
automake - 重新编译hunspell时如何告诉automake找到我的aclocal版本?
我目前正在从 Fedora 下载的 git 源重新编译 hunspell,如下所示:
正如 HACKING 中的步骤所述,我安装了所有先决条件并执行构建命令:
我收到了这个错误信息:
我的电脑安装了 automake 1.14。
当系统“制造”时,会发生有问题的陈述。无论如何我要告诉 make 找到我的 aclocal 吗?我试图在制作时追踪步骤。我应该发布列出的步骤吗?
谢谢大家。
hunspell - 词库索引文件中的单词编号
我想知道词库词典是如何构建的。.dat 文件和索引文件 .idx 之间有什么关系?例如,th_en_CA_v2.dat 文件中的相关条目如下所示...
th_en_CA_v2.idx 文件中的相关条目
word ploy 旁边的数字 (12626348) 是什么?
linux - Rstudio 中的拼写检查
如何在 Rstudio 中配置和使用拼写检查?在工具>全局选项>拼写中,我将主词典语言设置为英语(美国),并将自定义词典设置为来自“/usr/lib/rstudio/resources/dictionaries/en_US.dic”的 en_us。
我仍然没有看到任何拼写错误的迹象(例如红色品牌)!
python - 如何使用 pyhunspell 向 .dic/.aff 文件添加新单词?
我正在使用pyhunspell
它是一个 python 包装器HunSpell
,一个基于 .dic/.aff 文件的拼写检查器、词干分析器、单词分析器。的文档pyhunspell
可在此处找到。不幸的是,文档页面没有演示如何通过 Python 脚本向字典添加新单词/扩展字典。然而 的源代码包含一个函数,但与其他函数不同,没有解释,例如这个函数期望什么参数。以前有没有人设法调用过这个函数并且可以给我写一个如何使用这个函数的例子?pyhunspell
add()
add()
add()
这是我想调用的函数的 C 源代码,但我的 C 语言太有限,无法理解这里发生了什么。
谢谢你。
更新:
正如@RedX 所暗示的,我尝试使用 1 或 2 个参数调用 add() 函数。以下是我的发现:
例如,我使用 hu_HU(匈牙利语)字典文件(.dic 和 .aff),这是我需要为应用程序使用专门的领域词汇表扩展的文件。为了使示例对英语使用者透明,我选择了一个尚未包含在 hu_HU 词典中的名称 (McNamara)。由于匈牙利语是一种形态非常丰富的语言,所以我需要关心单词的偏角,否则单词的词干将不起作用。
McNamara
遵循与已经被识别的相同的偏角模式Tamara
并且可以正确地进行词干,例如对于单词 Tamarával(“with Tamara”)
将输出 ['Tamara'],这是正确的。
现在,如果我尝试使用新单词和示例调用 add():
这会给我一个TypeError: function takes exactly 1 argument (2 given)
. 然而@RedX 基于 C 代码的建议似乎是合乎逻辑的。
此外,如果我使用单个参数调用 add("McNamara") ,它似乎只会为当前会话添加新单词,而不是为脚本的下一次运行添加新单词,例如:
这会打印True
,但是下次我只使用最后一行运行脚本时,它将返回一个False
.
dictionary - Hunspell, unmunch - dump whole dictionary, encoding error
I'd like dump hunspell's pl_PL dictionary.
I found the solution: unmunch /usr/share/hunspell/pl_PL.dic /usr/share/hunspell/pl_PL.aff
But there's problem with encoding.
Part of the output:
I've also tried filtering output with iconv, but the problem wasn't solved:
How can i solve this problem?
java - 带有 hunspell 分析器的 ElasticSearch
我想在 ElasticSearch 中创建一个索引,该索引存储具有一些字符串字段的特定类型的数据。语言是匈牙利语。
我使用以下正文运行了一个 HTTP PUT 命令:
然后我插入了一条带有一些测试文本的记录,如果我通过 Elastic API 使用 GET 请求运行搜索,如下所示:
只有当我的测试文本与我的记录中的一个单词相同时,它才会找到我的记录。
我尝试通过分析API分析一些类似的文本:
它正确地标记了我的测试文本。基于这个事实,我希望如果我将以前找到的令牌放入我的搜索查询中,它会找到记录,但事实并非如此。
对于一个英语示例,我会说我的文本是“难忘的”,而我的查询是“忘记”。我应该怎么做才能找到记录?
elasticsearch - Elasticsearch hunspell 删词太多
以以下映射为例:
我已经从官方 Mozilla 页面下载了 hunspell 词典。
现在的问题是某些词,例如啤酒,被过度分析了。以下查询将啤酒转化为蜜蜂,这不完全正确?
Hunspell 语法很难理解。可以做些什么来避免这种行为?是否可以保留一些单词或添加一些规则?
dictionary - Hunspell 中的属性“TRY”是什么意思
Hunspell 词缀文件可能包含属性 TRY。它能做什么?Hunspell 文档说:
Hunspell 可以建议正确的单词形式,当它们与错误的输入单词相差一个 TRY 字符时。TRY 的参数区分大小写。
但我不明白这是什么意思。我有以下词缀和字典文件:
.aff
.dic
和 Hunspell 输入:
您可以看到,单词“sreate”、“sreated”、“crzated”与正确的单词形式的不同之处在于“s”和“z”字符。为什么会发生这种情况?
先感谢您。
macos - 使用 hunspell 进行 Emacs 拼写检查:没有进行拼写检查
我想在 GNU Emacs 24.5.1(在 Mac OS X 11.10 上)中激活拼写检查。我做了以下事情:
(hunspell -D
从终端正确运行)。在~/.bash_profile
我设置export DICTIONARY=en_US
和我的~/.emacs
节目中:
但是,当我打开任何.txt
文件时,我看不到带下划线的拼写检查错误或任何内容......并且M-x ispell
显示ispell-parse-hunspell-affix-file: ispell-phaf: No matching entry for nil.
. 我怎样才能让它工作?
cmake - 如何让 CMake 找到我的 libhunspell?
我正在尝试构建一个(有点)需要 libhunspell-dev 的应用程序。我不是root,所以我下载了hunspell:
在$HOME/opt/hunspell
. 我还设置:
而且,cmake 告诉我:
我该怎么办?