问题标签 [spell-checking]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java 斯坦福 NLP:拼写检查
我正在尝试使用斯坦福 NLP 检查文本样本的拼写准确性。它只是文本的度量,而不是过滤器或任何东西,所以如果它稍微偏离一点也没关系,只要错误是统一的。
我的第一个想法是检查词典是否知道这个词:
但是,这会产生很多误报:
关于如何更好地做到这一点的任何想法?
javascript - 对 WebKit 中的文本区域强制进行拼写检查
我正在创建一个基于浏览器的 QC/数据输入应用程序,它可以让人们编辑 OCRed 文件,这些文件自然会产生大量错误。数据块放在文本区域中以便可以检查它们,但红色下划线仅在用户手动将光标放在拼写错误的单词上时才会出现。
有没有办法强制 WebKit 将红色的小拼写检查下划线添加到 textareas?
c# - 如何确定两个相似的乐队名称是否代表同一个乐队?
我目前正在开展一个项目,该项目需要我将我们的乐队和场地数据库与许多外部服务相匹配。
基本上,我正在寻找确定两个名称是否相同的最佳方法的方向。例如:
- 我们的数据库场地名称 - “The Pig and Whistle”
- 服务 1 - “猪和哨子”
- 服务 2 - “猪与哨子”
- 等等等等
我认为主要区别在于缺少“the”或使用“&”而不是“and”,但也可能存在拼写略有不同和单词顺序不同等问题。
在这种情况下通常使用哪些算法/技术,我是否需要过滤噪音词或进行某种拼写检查类型匹配?
你见过 c# 中类似的例子吗?
更新:如果有人对 ac# 示例感兴趣,您可以通过谷歌代码搜索 Levenshtein 距离来访问一个堆
python - Pylons 中的 TinyMCE 拼写检查器
我一直在尝试让 TinyMCE 拼写检查器与我的 Pylons 应用程序一起工作。我的第一个问题实际上是首先捕获帖子数据。Firebug 告诉我正在发送以下内容:
它看起来像一串 JSON。没关系,我可以处理,但它不会出现在我的 request.params 字典中。有没有人有任何经验让这个与 Pylons 一起工作或一些东西让我尝试?我知道拼写检查器旨在与 PHP 后端一起使用,但这不应该造成任何重大障碍,不是吗?
此外,任何人都可以提供有关响应应该是什么样子的任何见解吗?这个插件的文档似乎非常不完整。
c++ - MFC 中的拼写检查
我一直在寻找一种可以插入商业 MFC/C++ 应用程序的多语言(特别是英语和瑞典语)支持拼写检查的解决方案。
在我的谷歌搜索中排名靠前的是Wintertree,它似乎符合所有标准,但对于 3500 美元的站点许可证来说并不便宜。现在我知道使用一些开源选项可能需要几天的工作才能开始工作,这本身就有成本,但我仍然想知道是否有任何备受推崇的更便宜的选项。或者当然是免费的,但是我们的产品是闭源的,而且我看到的许多免费选项都是 GPL。
感谢您的任何建议或个人经验。
textarea - Textarea 拼写检查属性 XHTML Strict
我想在包含 HTML 嵌入代码的文本区域中关闭某些浏览器(例如 Firefox 和 Opera)中的内置拼写检查功能,供访问者复制和粘贴。这可以通过以下属性来完成:
拼写检查 =“假”
但是,这会导致 XHTML Strict 的验证错误。此外,它在 Opera 中无法正常工作,因为在用户选择文本区域中的嵌入代码后会返回拼写检查。是否有另一种关闭拼写检查功能的方法?
javascript - 将拼写检查添加到我的网站
我有一个基于 asp 的网站,我想为页面上的 textarea 元素添加拼写检查功能。大多数页面都是从引擎生成的,尽管我可以向它们添加 JavaScript。所以我首选的解决方案是基于 JavaScript 的解决方案。我已经尝试过JavaScriptSpellCheck并且它工作正常,但我想看看我的其他一些选项可能是什么。我还找到了spellchecker.net,但服务器许可证的价格为 3500 美元,这似乎太高了。
拼写检查可以在单独的窗口中进行,并且必须支持多种语言(越多越好)。最终,我想向拼写检查对象发送一个文本区域名称或 id 的集合或分隔字符串(最好是名称,因为它们已经存在于页面中)并让它对所有这些对象进行拼写检查,在更正拼写时更新文本。
dictionary - 在哪里可以找到 IntelliJ 的其他语言的词典?
IntelliJ 拼写检查器仅捆绑了英语和阿拉伯语(奇怪,我认为它是在东欧制造的,他们甚至没有捆绑他们的语言?)。
我的客户是德国人,所以我所有的代码都是混合的英语(代码)/德语(界面),我找不到 IntelliJ 的德语词典。
python - 对 HTML 文档执行拼写检查的高效算法
我有一个 HTML 文档、一个常见拼写错误列表以及每种情况的正确拼写。HTML 文档将多达约 50 页,并且有约 30K 拼写更正条目。
纠正此 HTML 文档中所有拼写错误的有效方法是什么?
(注意:我的实现将在 Python 中,以防您知道任何相关的库。)
我想到了两种可能的方法:
- 构建拼写数据的哈希表
- 从 HTML 中解析文本
- 按空格将文本拆分为标记
- 如果拼写哈希表中的标记替换为更正
- 使用更新的文本构建新的 HTML 文档
这种方法对于多词拼写更正将失败,这将存在。以下是一种更简单但似乎效率较低的方法,适用于多词:
- 迭代拼写数据
- 在 HTML 文档中搜索单词
- 如果单词存在替换为更正
c# - hunspell 拼写检查
我有一个特定的问题要重新排序 hunspell 返回的错字建议单词。这些词似乎以字母顺序返回。我想按相关性对建议进行排序,即最接近的匹配应该首先出现。我无法通过 hunspell apis 找到任何方法来做到这一点。如何做到这一点?