问题标签 [languagetool]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1837 浏览

java - 语言工具示例:java.lang.NoSuchMethodError: org.apache.xerces.impl.xs.XMLSchemaLoader.loadGrammar

当我尝试从

http://wiki.languagetool.org/java-api

提供的解决方案: java.lang.NoSuchMethodError: org.apache.xerces.impl.xs.XMLSchemaLoader.loadGrammar

这意味着 LanguageTools 依赖项中指定的 Xerces 将是造成麻烦的那个。

mvn dependency:tree | grep -i xerces

不显示任何结果,并且在 Languagetools pom.xml Xerces 中明确排除。

我自己的测试项目具有以下 xerces 依赖项:

我假设我确实摆脱了这些依赖项之一,更改了依赖项的顺序或为 LanguageTool 添加了正确的 xerces 依赖项。什么是正确的方法 - 其中一种或其他方法?

0 投票
1 回答
1057 浏览

java - 如何添加要被 LanguageTool 忽略的两个单词模式?

情况:

作为尚未实现的将用户词典添加到 Languagetool 的功能的一种解决方法,我想出了以下代码片段:

这将很好地添加由指定的单词列表

到被忽略的单词列表。但是单词组合/两个单词模式,如“Guest bath”、“French word”、“test application”——如何在不修改原始语法文件的情况下忽略这些?我假设创建一些用户定义的规则可以解决问题,并且对于上述代码片段也可能是一个更优雅的解决方案。

问题:

什么是一种有效的方法来解决忽略单个和两个单词短语的用户词典工作?

0 投票
1 回答
315 浏览

python - 如何关闭语言工具的建议机制?

我正在将语言工具与 python 一起使用。但是当我想要处理很长的文本或大量文本时,它会很慢。我继续阅读建议机制多长时间,我实际上不需要任何建议,我只对 rule_id 和类别感兴趣。

有人知道如何关闭这个建议机制以获得一些处理能力吗?

0 投票
0 回答
421 浏览

java - 带有非 jar 文件的 Eclipse 导出库

在使用外部库导出我的 eclipse 项目时,我遇到了以前从未遇到过的问题。我制作了一个带有拼写纠正功能的小程序,并使用了您可以在此处找到的语言工具库。

我将此库放在构建路径中并正确导入到我的 Eclipse 项目中。当我要求将其导出到可运行的 jar 中时,Eclipse 仅将 jar 文件导出到 languageTool 库中,但该库还包含一些 txt 和 xml 文件。因此,当我尝试从命令行启动应用程序时,它给了我错误,因为找不到这个 txt 和 xml 文件。我试图手动添加到我的 jar 档案中,但显然它不起作用。我该如何解决?

感谢您的时间,并原谅我的英语不好。

0 投票
1 回答
290 浏览

scalability - LanguageTool 的可扩展性

我想扩展LanguageTool HTTP 服务器,以便它可以一次处理大量用户请求并处理非常大的文本。实现这一目标的最佳方法是什么?

0 投票
1 回答
71 浏览

java - 用于处理所需语法案例的单词的语言库?

是否有任何库可以将输入单词转换为所需的语法大小写(属格、主格等)和复数/单数形式?

基本上我对英语、德语、俄语感兴趣。

我知道有类似apache luceneand的库language-tool,但似乎它们可以进行词干提取和词形还原,并且可以用于搜索和拼写检查,但不能用于文本转换。

0 投票
1 回答
341 浏览

java - 在语言工具上创建字典

我正在尝试创建一个法语词典以在语言工具拼写检查器上使用它。代码本身似乎创建了它,但这不是我的情况,因为我在我的文件夹中找不到 .dict 文件。希望您能帮助我-也许这只是对Java代码的错误使用。

0 投票
2 回答
1867 浏览

java - 在 LanguageTool 中,如何创建字典并将其用于拼写检查?

如何使用 Language Tool 创建用于拼写检查的字典?我不是Java程序员,这是我第一次看到LT。

0 投票
0 回答
101 浏览

regex - Plurals and third person in LanguageTool (using regex?)

I am terrible with grammar in general, and with s's in particular : I forget to put an s at the end of plural nouns and verbs in the third person, and I put random s's at the end of singular nouns and verbs not in the third person.

I use Texstudio with LanguageTool to edit scientific papers. Unfortunately LanguageTool misses most of those s's mistakes I regularly make.

I know the basics of adding rules to LanguageTools, including rules using regex. But I have a hard time coming up with a rule that would best catch those s's mistakes.

My question : Any idea what that(these) rule(s) could look like?

Notes :

  • I am not attached to using regex. Any suggestion using regex when effective and other strategies otherwise is welcome
  • What really matters to me is a rule that flags potential mistakes. I don't care much about the rule proposing an appropriate correction. Drawing my attention to potential mistakes suffices : once I see them, I can recognize them and correct them.
  • What I have so far is a very coarse rule which simply flags every word finishing with an s (\w*s\b). As I write and encounter words that naturally finish with an s (like "is" or "this"), I progressively add them as exceptions to the rule. That helps a little, but it is both too inclusive -- too many words get flagged, which means I start paying less and less attention to flagged words -- and not inclusive enough -- it doesn't identify any word for which an s is potentially missing.
  • As suggested by my current \w*s\b strategy, I am open to partial solutions. Any suggestion better than \w*s\b that I could implement in LanguageTool is much welcome.
0 投票
1 回答
110 浏览

regex - 语言工具规则中的标点符号

我不知道我们如何编写规则,其中令牌涉及单词和标点符号的组合。

我应该如何处理LanguageTool规则中的标点符号?

我在网上查了一下,尝试了几件事无济于事。

例如,两者 1)

2)

和 3)

失败的。另一方面

工作,尽管没有考虑到我想做的点。

注意:我在LanguageTool里面使用Texstudio