问题标签 [spell-checking]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
11 回答
14792 浏览

c# - .NET 拼写检查控件?

是否有任何具有拼写检查功能的 .NET 库(最好是自包含的文本编辑控件)。我想在我的应用程序的编辑区域中为拼写错误的单词添加典型的红色下划线。

编辑:澄清一下,这是针对 WinForms

0 投票
8 回答
4325 浏览

c# - .NET 文本编辑器,接受 HTML 和带有拼写检查的输入/输出

我一直在寻找可以做到这一点的东西,但还没有运气……我们有一个内部应用程序,它以 HTML 格式存储/使用文本。现在我正在寻找一个新的控件来编辑它。

不需要功能齐全的 HTML 编辑器,只需要可以处理简单格式的东西。它还需要拼写检查功能。一开始,我们使用嵌入了 Microsoft 的 DSO 成帧器控件的 Word。这导致了工作站上的 COM 问题和性能问题。最近我们一直在编辑模式下使用 IE。这解决了性能问题,但没有解决 COM 问题。

我想找到没有外部依赖的东西,或者至少那是所有托管代码。我不介意围绕richtextbox 构建我自己的控件,但我担心HTML-> RTF-> HTML 转换。由于我们必须处理传入的电子邮件,我们不能太自信地只使用 HTML 的子集。如果它符合我们的需求,我们也会考虑购买一个组件。我更喜欢轻量级的东西。我们不需要重新嵌入 Word!

有没有其他人遇到同样的问题?你是怎么解决的?

0 投票
6 回答
4273 浏览

algorithm - 拼写检查城市名称?

我认为这个问题比普通的拼写检查更容易,因为与所有已知的英语单词相比,美国城市的列表很小。

无论如何,这是问题所在:我有充满城市名称的文本文件;其中有些拼写正确,有些拼写不正确。

我可以使用什么样的算法来纠正城市名称的所有拼写错误?

0 投票
3 回答
2442 浏览

.net - 如何最好地实现脏话处理程序(.NET 首选)?

对于 ASP.NET 应用程序,自定义脏话删除器/替换器的最佳实践实现方法是什么?

如果这是一个数据表解决方案,是否有免费资源来获取数据?(类似于查找可以导入系统进行拼写检查的公共字典表)

0 投票
18 回答
97206 浏览

algorithm - 谷歌“你的意思是什么?” 算法工作?

我一直在为投资组合管理工具开发一个内部网站。有很多文本数据、公司名称等。一些搜索引擎能够非常快速地响应“您的意思是:xxxx”的查询,这给我留下了深刻的印象。

我需要能够智能地接受用户查询,并且不仅可以使用原始搜索结果进行响应,还可以使用“您的意思是吗?” 当有一个很可能的替代答案等时的响应

[我在ASP.NET中开发(VB - 不要反对我!)]

更新:好的,如果没有数百万“未付费用户”,我怎么能模仿呢?

  • 为每个“已知”或“正确”术语生成拼写错误并执行查找?
  • 其他一些更优雅的方法?
0 投票
3 回答
585 浏览

language-agnostic - 文本中单词的自动拼写检查

[编辑]简而言之:您将如何编写自动拼写检查器?这个想法是检查器从已知的良好来源(字典)构建一个单词列表,并在足够频繁使用时自动添加新单词。一段时间未使用的词应逐步淘汰。因此,如果我删除包含“Mungrohyperiofier”的场景的一部分,检查器应该记住它一段时间,当我在另一个场景中输入“Mung<Ctrl+Space>”时,它应该再次提供它。如果我不使用这个词,比如说,几天,它应该忘记它。

同时,我想避免在字典中添加拼写错误。[/EDIT]

我想为科幻故事写一个文本编辑器。编辑应该为当前故事中任何地方使用的任何单词提供单词补全。它只会提供故事的单个场景进行编辑(因此您可以轻松地移动场景)。

这意味着我有三套:

  1. 所有其他场景中所有单词的集合
  2. 在我开始编辑之前当前场景中的一组词
  3. 当前编辑器中的单词集

我需要将这些集合存储在某个地方,因为每次都从头开始构建列表太昂贵了。我认为一个每行一个单词的简单纯文本文件就足够了。

当用户编辑场景时,我们有这些情况:

  1. 她删了一个字。这个词在当前场景中的其他任何地方都没有使用。
  2. 她打出一个新词
  3. 她输入了一个已经存在的单词
  4. 她输入了一个已经存在但打错字的单词
  5. 她更正了第 2 组中一个单词的错字。
  6. 她更正了第 1 组单词中的错字(即错字也在别处)。
  7. 她删除了一个她打算再次使用的词。但是,删除后,该单词不再位于集合#1 和#3 中。

显而易见的策略是在保存场景时重建单词集,并从每个场景的单词列表文件中构建集#1。

所以我的问题是:是否有一个聪明的策略来保留不再使用的单词但仍然能够逐步淘汰拼写错误?如果可能的话,这个策略应该在后台运行,用户甚至不会注意到发生了什么(即我想避免必须抓住鼠标从菜单中选择“将单词添加到字典”)。

[编辑] 基于悲伤的评论

0 投票
4 回答
5120 浏览

sql - 示例 [英文] 用于填充表的字典 SQL 脚本?

有谁知道网络上包含示例英语词典单词脚本的参考链接,可用于填充 SQL Server 中的词典表?

我可以处理 .txt 或 .csv 文件,或类似的文件。

或者,我正在向我的网络应用程序添加自定义拼写检查功能......但我不想集成标准组件。如果在构建字典单词检查器方面有很好的参考资料(带有示例),我也会喜欢的!

0 投票
7 回答
14702 浏览

c - 拼写检查器如何工作?

我需要在 C 中实现一个拼写检查器。基本上,我需要所有标准操作......我需要能够对一段文本进行拼写检查,提出单词建议并动态地将新单词添加到索引中。

我有点想自己写这个,虽然我真的不知道从哪里开始。

0 投票
17 回答
74780 浏览

nlp - 检测单词中的音节

我需要找到一种相当有效的方法来检测单词中的音节。例如,

隐形 -> in-vi-sib-le

有一些可以使用的音节规则:

V CV VC CVC CCV CCCV CVCC

*其中 V 是元音,C 是辅音。例如,

发音(5 Pro-nun-ci-a-tion;CV-CVC-CV-V-CVC)

我尝试了几种方法,其中使用正则表达式(仅在您想计算音节时才有帮助)或硬编码规则定义(证明非常低效的蛮力方法),最后使用有限状态自动机(确实没有任何有用的结果)。

我的应用程序的目的是创建给定语言的所有音节的字典。该词典稍后将用于拼写检查应用程序(使用贝叶斯分类器)和文本到语音合成。

除了我以前的方法之外,如果有人能给我关于解决此问题的替代方法的提示,我将不胜感激。

我在 Java 中工作,但 C/C++、C#、Python、Perl 中的任何技巧都对我有用。

0 投票
1 回答
3125 浏览

notepad - 为记事本配备拼写检查(键入时)功能——最好的选择?

我不需要任何具有一系列功能的替代文本编辑器。我只想在记事本中检查我的文本(在我键入时)以查找任何拼写错误。最好的选择是什么?提前致谢。