问题标签 [spelling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
7978 浏览

r - 在 R 中匹配文本字符串时处理错误的拼写

我正在收集调查数据(使用开放数据工具包),我的现场团队,祝福他们的心,有时会在人名的拼写上有点创意。所以我有一个“正确”的受访者姓名,以及一些与“家庭成员姓名”变量相关联的记录的年龄变量。有许多不同年龄的家庭成员。我想要受访者的年龄。

这是一些说明我的问题的假数据:

在我的真实数据中,我有数百人和多达 13 个家庭成员。从那以后,我将调查更改为分别记录受访者的年龄,但我有一堆数据需要清理。

0 投票
1 回答
959 浏览

emacs - 接受本地文件字典的单词时,Emacs ispell 错误

在每个 .tex文件中,当我键入A(shift a) 以接受一个新单词时,我会Wrong type argument: sequencep, 1在 minibuffer 或消息缓冲区中收到错误消息:

如果我在文件底部添加类似于以下内容的行:

我可以(A)接受有限数量的单词,大体上最多 50 个新单词字符,直到行尾。然后我再次得到同样的错误。如果我像前面一样添加另一行,因此:

我可以再继续到行尾。此后错误再次显示。

至于我的初始化文件,我有这些看似无辜的行:

总而言之,每当需要开始本地文件字典的新行时,ispell-add-per-file-word-list都会遇到麻烦。

0 投票
0 回答
234 浏览

linux - 通过指定字典从命令行使用 aspell 和管道

我有以下问题。我在文件“a.dict”中有一个单词列表。其中包括特定的品牌名称(不仅仅是字典中的单词)。例如像

这是我要对照“a.dict”检查的字典。此外,我还有另一个文件,其中包含人类输入的单词,其中有拼写错误,例如

我想使用 GNU 的 aspell 来执行以下操作。1)检测是否与字典中的单词完全匹配 2)如果可能,输出最有可能被纠正的单词并带有一些分数,以便我可以选择是否接受某个级别的更正。

有没有办法在 ubuntu 上使用 aspell 轻松做到这一点?

非常感谢提前

0 投票
1 回答
1073 浏览

html - 在 HTML 页面上添加拼写建议

我是 Web 开发的新手,只是想向textarea. 我真的不知道我需要什么,需要自己编写代码或使用第三方库等。有人可以建议我如何将此功能添加到HTML包含 textarea. 我想当我在文本区域写一个拼写错误的单词时,一些与该单词匹配的建议应该出现在下拉列表中。

0 投票
2 回答
1137 浏览

python - 拼写更正可能性

正如大多数拼写纠正导师所说,拼写错误的单词 x 的正确单词 W^ 是:

W^ = argmax W P(X|W) P(W)

其中 P(X|W) 是可能性,P(W) 是语言模型。

在我学习拼写纠正的教程中,讲师说 P(X|W) 可以通过使用混淆矩阵来计算,该矩阵跟踪我们语料库中的一个字母被错误地输入另一个字母的次数。我使用万维网作为我的语料库,不能保证一个字母被错误地键入另一个字母。那么,如果我使用 X 和 W 之间的 Levenshtein 距离而不是使用混淆矩阵,可以吗?它有很大的不同吗?

我要计算列夫的方式。python中的距离是这样的:

看到这个

这是使我的问题更清楚的教程:单击此处

PS。我正在使用 Python

0 投票
4 回答
313 浏览

php - PHP中的拼写检查

当我运行这段代码时。我总是收到这样的错误:

当用户输入答案时,我如何设计结果?我想让它更生动。谢谢!

0 投票
1 回答
1494 浏览

python - 分析字段上的 ElasticSearch 术语建议不返回任何建议

我想使用 ElasticSearch 术语建议功能进行拼写更正(您的意思是...?)。这是官方文档

这是我的(简化为基础)方案:

这就是通过 Python/Django 为 a) 我们的博客索引数据的方式:

我正在根据每篇博客文章的语言(p.language = 'de' 或 'en')设置分析器,无论是German还是English

我可以搜索这个索引(通过 Python),并且确实得到了使用这些参数返回的拼写建议:

但是,我真正需要的是对我们的照片方案进行搜索的拼写建议,该方案由以下索引(Python/Django):

p.tags_en 和 p.tags_de 可以被索引为逗号分隔的标签字符串,或者作为实际的字符串列表。两者都适用于 ElasticSearch,它似乎对这个问题没有影响。

用英语和德语搜索照片都有效,但没有返回任何拼写建议:

如果我为建议术语定义分析器,这没有什么区别,如下所示:

请注意博客文章和照片之间分析的区别:我们的博客文章每篇文章都以一种语言进行分析。通过my_analyzer方案中的字段。但是,我们的照片是按字段进行分析的。我们确实有 20 种语言(这里只显示了两种以使代码尽可能小),并且相应地分析每个标签字段。如果我删除这种类型的照片分析,我也会在那里得到建议,但我们确实需要基于字段的分析器。

所以这个问题一定与分析仪有关,但我完全被困住了。有任何想法吗?

0 投票
2 回答
908 浏览

vim - Vim 中的整个文件的拼写检查

我目前正在使用 Vim 的拼写检查,它很棒,但是当敲出一个长字母或一些注释时,我经常发现忽略拼写错误并稍后再回来更容易。但是,捣碎[z然后更改单词有点烦人。我想知道是否有某种可以使用的向导aspell check方法(例如)来检查文档中所有拼写错误的单词并提供修复/添加/忽略它们的选项。

0 投票
1 回答
527 浏览

solr - Solr:LowerCaseFilterFactory 未应用于 SpellCheckComponent

我正在努力解决 Solr 中的 SpellCheckComponent(使用 solr 4.4 和 4.5 测试)。我有一个定义如下的字段类型:

使用 solr 管理分析器调查相应的字段,我可以看到,该字段在索引和查询模式下被正确分析。特别是,它是小写的。

但是,如果我在 SpellCheckerComponent 中使用此字段,我只会在术语以小写形式提供的情况下获得建议(例如,“bautrokner”有效,“Bautrokner”无效)。组件和请求处理程序定义为 solr wiki 中提供的(我知道 shingles 可能不是拼写更正所必需的,但我也使用该字段进行自动建议 - 完全相同的问题):

我已经搜索了几个小时的类似问题,但我找不到任何提示是什么问题。我希望由于查询分析器的原因,查询词应该小写。但情况似乎并非如此。

马蒂亚斯

0 投票
1 回答
963 浏览

java - Solr Cloud 中的分布式拼写检查问题

我正在从主从配置迁移到 Solr Cloud。我要迁移到的 Solr 版本是 4.4。我有 2 个分片,每个分片有 1 个副本。我面临一个分布式拼写建议的问题。我已经在我的请求处理程序中打开了拼写组件。这个想法是将建议(如果有的话)作为查询响应的一部分。

拼写检查搜索组件也非常标准。

我在两个分片中都运行了spellcheck.build=true。现在,如果我运行查询,

响应没有返回任何建议。但是,如果我明确添加distrib=false,我会收到建议

由于我的查询需要分发,并且我不希望单独的查询仅用于拼写检查,因此这种方式无法达到目的。

对此的任何指针将不胜感激。

  • 谢谢