问题标签 [hunspell]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows - hunspell 输入中的特殊字符被视为空格
这个问题是在超级用户上提出的,但在 7 天内只有 8 次浏览。Hunspell 知识渊博的人去stackoverflow,因此我在这里重新提出问题。
我正在使用瑞典语词典在命令行中测试 hunspell。交互模式下的输入在拼写检查之前用空格替换所有特殊字符(例如 å ä ö)。
如您所见,提示的编码正在工作,在输入和输出中都显示 å ä 和 ö。
管道给出相同的结果:
我尝试为 hunspell 提供不同的选项,包括-i UTF-8
,-i UTF-16
和保留 aff 文件的SET ISO8859-1
. 没有任何效果。
法语也会发生同样的事情:
还有输出问题。
我在 MinGW 中编译了 hunspell 并将生成的所需文件移动到我的路径中的某个位置,但我认为这些信息不是很相关。
如何让 hunspell 识别其输入的特殊字符?
php - 使用 utf-8 文本输入通过 shell_exec 调用程序
附加条件:hunspell
和php5
。
来自 bash 的测试代码:
- 工作正常。
测试代码(test.php):
返回
屏幕截图(无法使用无效字符发布代码):
似乎 shell_exec 无法正确处理 utf-8,或者可能需要一些额外的编码/解码?
编辑:我不得不使用 en_US.utf-8 来获取有效数据。
spell-checking - 是否可以让 Hunspell 打印拼错单词的行号?
我正在尝试使用Hunspell来纠正我写的一篇文章。不幸的是,它对我来说没用,只要它不打印拼写错误单词的行号。
所以现在我正在使用该-a
选项,以便能够将其通过管道传输到hunspell
命令中。手册页说,该-L
选项将“打印拼写错误的行”。但我看不出输出有什么不同。
这就是我现在所做的:
示例输出如下所示:
“JavaServer”这个词在第 78 行,正如手册页所解释的,它在该行有 412 个字符的偏移量。
有什么我想念的吗?这个问题是否有一个简单的解决方案,或者我真的必须将每一行输入 Hunspell 以找出它所在的行号?
提前致谢。
c++ - 处理带有特殊字符的 Hunspell 建议
我已使用 Visual Studio 2010 将Hunspell集成到 Windows 7 上的非托管 C++ 应用程序中。
我有适用于英语的拼写检查和建议,但现在我正试图让事情适用于西班牙语并遇到一些障碍。每当我收到有关西班牙语的建议时,带有重音字符的建议都无法正确翻译为std::wstring
对象。
Hunspell->suggest
以下是从该方法返回的建议示例:
这是我用来将其转换std::string
为std::wstring
在我运行完之后,我得到了这个,最后是时髦的角色。
谁能帮我弄清楚这里的转换会发生什么?我猜测它与从 hunspell 返回的负字符有关,但不知道如何将其转换为std::wstring
转换代码的内容。
ruby - 红宝石中的简单拼写检查方法/宝石?
我正在寻找一种相对快速的方法来检查单词是否拼写错误,无论是使用 gem 还是 API。
我尝试过使用几个 gem——raspell、ffi-aspell、hunspell-ffi、spell_cheker 和 spellchecker——每个都有不同的错误。
我对 ruby 很陌生,希望有一个简单的解决方案(我正在处理很多短文本文件,并且想要计算拼写错误的单词的百分比),其中不包括从头开始构建一些东西。
尝试 ffi-aspell 时,出现以下错误:
我将不胜感激(1)对上述方法的替代方法的建议或(2)使用上述 5 个 gem 的建议 - 所以我至少可以花时间调试最佳选择。
visual-studio-2010 - Hunspell 代码在 Visual Studio 2010 中不起作用
我必须在我的一个项目中包含拼写检查功能,我决定使用 hunspell,因为它是一个出色的拼写检查器(许多免费和专有软件都在使用它)。我下载了源代码并将项目 libhunspell 添加到项目中。让它编译没有任何错误,还从openoffice网站下载了英文词典。以下是我用来初始化 hunspell 引擎和类它的拼写检查功能的代码:
代码不会抛出任何错误,但无论单词是什么,hunspell_spell 总是返回 0。
emacs - 可用于 emacs 的交互式拼写检查程序
我最近切换到 emacs24 并升级到 Ubuntu 12.04。我似乎无法让 hunspell 再次正常工作。我发现 hunspell 通常比 aspell 好。Hunspell 只想使用澳大利亚词典而不是美国英语词典或冻结我的系统。使用 aspell,我可以毫无问题地切换字典或运行 flyspell 模式。
我的问题是人们如何在 emacs24 中设置交互式拼写?仍然使用 ispell 和 flyspell 或任何其他首选设置。你在使用 hunspell 和 emacs24 吗?我可能会继续尝试让这个工作,但想确认其他地方的人没有任何问题。
apache - Apache Solr 3.5 - 4.0 HunspellStemFilter 在控制台/命令行中使用相同的字典返回另一个值而不是 Hunspell
当我使用 HunspellStemFilter 对捷克语文本进行词干处理时,它给我带来了不好的结果。
例如单词“praha”返回“praha”和“prahnout”,这是不正确的。
所以我在我的控制台(Hunspell 命令行)中使用完全相同的字典尝试相同的操作,它只返回“praha”,这是正确的。
有人可以帮助我吗?
linux - 使用命令行对文件进行拼写检查,非交互方式
我有一个大文本文件,其中包含许多错误/拼写错误的英文单词。我正在寻找一种在 Linux 中使用命令行拼写检查器来编辑此文件的方法。我找到了一些方法来做到这一点,但根据我的搜索,它们都以交互方式工作。我的意思是,看到一个错过/拼写错误的单词,他们会向用户建议一些更正,他/她应该选择其中一个。由于我的文件相当大,并且包含许多错误的单词,我无法以这种方式对其进行编辑。我正在寻找一种方法来告诉拼写检查器使用第一个候选词替换所有错误的单词。有没有办法做到这一点?(a/hun)spell 有什么选择吗?
问候。
lucene - 使用 Lucene 和 Hunspell 生成所有单词形式
在我处理的一个应用程序中,我们使用 Lucene Analyzer,尤其是它的 Hunspell 部分。我面临的问题是:我需要使用一组词缀规则生成一个单词的所有单词形式。
例如,拥有单词“educate”和词缀规则ABC,生成所有形式的单词“educate”。- 教育,教育,教育等。
我想知道的是:是否可以使用 Lucene 的 Hunspell 实现来做到这一点(我们使用 Hunspell 字典(.dic)和词缀文件(.aff),所以它必须是一个 Hunspell API)?Lucene 的 Hunspell API 并没有那么大,我浏览了一下,没有找到合适的。
我能在 SO 上找到的最近的是this,但没有与 hunspell 相关的答案。
更新 1我不再从事我面临上述问题的项目,但如果仍然有使用 Lucene 的分析器执行此操作的解决方案,我很高兴社区会看到答案。