问题标签 [linguistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
98 浏览

javascript - 在javascript代码中搜索不包括复数的数据库

我有一个程序,我给它一个名词,它用一个名词表检查它的数据库,看看那个名词是否存在。这适用于单数名词。例如。用户类型,“什么是树?” 程序搜索“树”。

但是对于“什么是树?'

该程序将搜索“树”,但数据库仅以单数形式存储名词,因此无法找到。在进行搜索之前,我正在考虑取消最后一个 s。例如。

但是,这不适用于不是以“s”结尾的复数形式的名词,例如:Megalosaurus、Stegosaurus、Jesus、mass、bass、physics 和很多其他名词。

我可以列出一个以 s 结尾但不是复数形式的单词列表,然后搜索它是否首先在该列表中,如果它不删除最后一个“s”,否则执行..

我会对以“es”结尾的单词做类似的事情,除非它们在以“es”结尾的非复数单词列表中。

有没有更好的方法来做到这一点?

0 投票
1 回答
144 浏览

qt - QLinguist 无法翻译警告信息

在 Qlinguist 中,我翻译了 ui 和一些相应的警告信息,生成了qm文件并加载了它,但结果它只能翻译 ui,而不能翻译那些警告信息。我的代码是这样的:

我的警告信息之一是这种形式:

这个字符串可以通过 加载lupdate,我在它的qm文件中翻译了它,但是运行后仍然看不到它的翻译。在这里我问了这个问题,但我必须打开这个新问题才能在某人的帮助下解决它。有人可以帮我吗?先感谢您。

0 投票
1 回答
361 浏览

algorithm - 用于查找合适的替代词、缩写词或单词速记的算法或 API

我们想为给定的单词生成一个合适的缩写或速记。例如,如果有人给我们“图片”,我们会产生“pix”,或者如果有人给我们“票”,我们会产生“tix”。

是否有任何 API 或算法可以帮助解决这个问题?我们知道 Wordnik,但它并没有提供我们正在寻找的东西。

目前最好的选择是手动编译字典。好像没那么热

0 投票
1 回答
100 浏览

text - 给定一个包含几十个单词的列表,我如何从数百个文本的语料库中找到最匹配的部分?

假设我有一个包含 250 个单词的列表,其中可能包含自始至终的唯一条目,或者所有语法形式的一堆单词,或者特定语法形式的各种单词(例如,所有过去时)。我还有一个文本语料库,它被方便地分成了一个部分的数据库,每个部分可能有 150 个单词(也许我想在将来动态地确定这些部分,但我暂时不考虑它)。

我的问题是:什么是从包含我的 250 个单词中的大部分的语料库中取出这些部分的有用方法?

我查看了一些全文搜索引擎,例如 Lucene,但不确定它们是为处理长查询列表而构建的。布隆过滤器似乎也很有趣。我对 Perl 感觉最舒服,但如果 R​​uby 或 Python 有什么花哨的东西,我很乐意学习。在这一点上,性能不是问题。

这种程序的用例是在语言教学中,如果有各种各样的单词列表来反映学习者的不同程度的知识,并从原始来源快速找到合适的文本或示例,那就太好了。另外,我只是想知道如何做到这一点。

0 投票
1 回答
211 浏览

ruby - 如何将单词转换为等效数字?

如果我有一个写为字符串的正整数,例如"three"or "forty nine",是否有一种简单的方法可以将其转换为整数?

我很高兴使用语言学来转换另一种方式,但我从未尝试过这种方式!

0 投票
3 回答
980 浏览

qt - 使用 Qt 进行应用程序翻译:中文标题失败

我正在使用 Qt4 开发一个多语言应用程序,除了中文翻译外,一切都很好:我的所有文本都按我想要的方式翻译,但 Windows 标题不起作用。

当我在 Qt Linguist 中编辑 cn.ts 文件时,它会显示中文字符,但在 lrelease 和应用程序运行后,我的所有 Windows 标题都显示小矩形,因为它无法识别字符,只有 Windows 标题无法正常工作(消息文本按钮文本...)工作正常。

任何帮助将不胜感激。

0 投票
2 回答
4523 浏览

qt - Qt Linguist - 为应用程序 Qt *.ui 文件设置翻译器

在菜单中选择语言后,我编写了一个小而简单的示例来更改应用程序语言。尽管连接确实有效(qDebug() 打印出好的消息),但它不会更改我的 QLabel 上的文本。我使用 QtDesigner 创建了 GUI。注意:所有这些文件都在同一个目录中。我正在使用 Qt5。这是我的代码:

* .亲:

主窗口.cpp

主窗口.h

主文件

ic.ts

主窗口.ui

0 投票
5 回答
3503 浏览

c++ - 检查字符串是否包含英文句子

截至目前,我决定拿一本字典并遍历整个内容。每次看到换行符时,我都会创建一个包含从该换行符到下一个换行符的字符串,然后执行 string.find() 以查看该英文单词是否在其中。这需要很长时间,每个单词大约需要每秒 1/2-1/4 秒来验证。

它运行良好,但我需要每秒检查数千个单词。我可以运行几个窗口,这不会影响速度(多线程),但它仍然只能每秒检查 10 个。(我需要数千)

我目前正在编写代码来预编译一个包含英语中每个单词的大型数组,这应该会加快速度,但仍然没有达到我想要的速度。必须有更好的方法来做到这一点。

我正在检查的字符串如下所示:

但其中大多数包含完整的垃圾,只是随机字母。

我无法检查不可能的字母组合,因为在“thatmust”之间,该字符串会因为“tm”而被丢弃。

0 投票
3 回答
283 浏览

algorithm - 在随机文本中查找语言模式

我编写了一个脚本来生成可能的 twitter 句柄并检查它们的可用性。它只是遍历允许的符号的不同组合:a-z, 0-9, _. 目前它已经检查了 1926220 个组合,即每个包含 1-5 个符号的组合。以下是简要结果:01、2 和 3 个符号的免费帐户,4 个免费帐户,5 个免费750帐户442711

我想知道是否有可能编写一个算法来分析这些列表并在其中找到人类可读的单词。这是一个例子:

这个词elosu与其他词不同,事实证明西班牙甚至有一个小镇叫埃洛苏。人类如何区分这些词?我想我可以尝试制作一本不同语言的音节标签字典,并尝试将单词与之进行比较。你能帮我用公式或其他想法吗?

更新:对于那些想要尝试实现它的人,这里是5-symbol handles的链接。

0 投票
1 回答
316 浏览

sql - 在 1500 万单词的语料库中查找单词的句子

我有一个 1500 万字的语料库,我想将其存储在数据库中。然后我希望能够找到给定单词,它在语料库中的上下文。例如,对于“朋友”这个词,我可能会选择以下内容,我也会在每个“朋友”之前和之后选择五个词:

我怎样才能最好地组织我的数据库以以这种方式有效地选择给定的单词?当我需要数据库时,我通常使用 sqlite,但在这种情况下,也许其他东西会更好。