问题标签 [linguistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
167 浏览

qt - Qt 语言学家为什么我不能更改默认翻译

我试图从 linguist 工具中打开一个默认的 ts 文件,并发现我无法编辑翻译,如果我已经安装了二进制文件。但是如果我自己构建了源代码,我就可以做到这一点。有人可以解释为什么会这样吗?

0 投票
1 回答
644 浏览

keyword - 从荷兰语短文本中提取关键字

我想从简短的荷兰语文本中提取关键字。是否有此 API 或我可以使用的某个库。

如果这些不适用于荷兰语,任何有关如何自己提取它们的提示也将不胜感激。我已经通过词性标注器和词形还原器运行文本自己尝试过。但从那时起,我发现很难提取出像样的关键字。TF-IDF 没有用,因为文本太短而无法获得好的结果。

我更喜欢 Java,但也非常欢迎任何其他语言实现。

0 投票
2 回答
218116 浏览

linguistics - 有没有自动为短语/句子绘制树形结构的在线应用程序?

即,它将任何句子/短语作为输入并自动计算出树形图。

我正在寻找一种方法来查看我不确定如何绘制其树结构的句子/短语的树结构。

0 投票
1 回答
732 浏览

ios - 如何在 iOS 上生成英语句子的解析树?

我想在 iOS 应用程序中生成基于选区的英语句子解析树。 http://en.wikipedia.org/wiki/Parse_tree

我目前的选择似乎是:

  • 在 NSLinguisticTagger 的 POS 标记之上编写我自己的树生成。
  • 将基于 python 的 NLTK 嵌入到我的应用程序中。
  • 创建或使用基于服务器的方法。

任何人都可以推荐其中一种方法,或者建议另一种方法吗?

0 投票
2 回答
755 浏览

nlp - 如何将文本修剪成一定长度的完整句子?

我正在寻找一种将未知文本修剪到一定长度的解决方案。只保留完整的句子。

所以像这样的文字

应该变成

字符限制为 50、40(和 20 与 --find-next-sentence-ending)。

我读过很多 SO question - 大多数答案都是

但这显然不适用于上述句子和其他类似句子。其他人建议使用斯坦福文本解析器或 OpenNLP。它们真的很酷,但不适用于典型应用。您不会在 Ruby/PHP 服务器上安装 Java,只是为了修剪文本,对吧。所以我正在寻找一些 80/20 的解决方案,它与语言无关,并且能够处理出现的典型案例。

我想不出比这更有问题的句子(在下一个句子的开头包含日期、非点句结尾和非 ascii 字符,以及“限制”句中间的非结尾点)。

我还创建了一个 GIST (https://gist.github.com/4051035) 供您分叉和玩 - 分叉确保用户可以点击此问题的不同解决方案,所以请使用它;) 我想提出这个问题comunity-wiki,但它似乎不适用于问题 - 仅用于答案。因此,请在评论中添加任何建议/相关的 SO 问题。谢谢。

0 投票
2 回答
389 浏览

cryptography - 如何识别单词是否没有意义,也许是一些不可能的音节?

最初,我有m个包含n 个字符的数组,其中每个数组包含所需单词的未知(对我而言)字符(条件:单词有意义)。

例如m =4,n =3:array0={' t ',' e ',' c ' },array1={' g''o''a ' } , array2= { ' w''d ' ' y '}, array3 = {'e''o ' 's ' }。每个数组只包含一个正确的字母:在array0中是第一个字母,在array1中-第二个......所以,可能的秘密词是' code ':array0[2] =' c ',array1[1] =' o ',数组2[1] = '

我需要找到所有现有的字母组合,即排除生成的无意义单词。英语中“不可能”的音节/字母组合是否有任何规则/规则?

我正在攻击 Vigenere 的密码。所以,我知道密钥的长度及其可能的字符。我正在改组我的数组并得到许多无意义的单词。问题是过滤它们。据我了解,某些条件可以帮助识别错误的单词。例如,如果字长 > 4,则所有元音字符或所有辅音字符都是错误的。某些音节,例如kk *hh* ww,一般来说也是不可能的。我在哪里可以找到这样的规则?

0 投票
0 回答
133 浏览

keyboard - 与语言无关的键盘:用英语培养中性文本 -kbd 没有变音符号之类的东西?

我喜欢在编程时使用美国德沃夏克国际键盘——每本手册、每份文档,也可以使用它进行编程。我把我的老师逼疯了,因为他们时不时地要求我用不同的语言写东西,比如德语、芬兰语、瑞典语或挪威语。我的成绩往往会愚蠢地下降,因为我懒得换键盘,错过了变音符号等奇怪的东西。我发现键盘切换速度很慢,而且我现在的 Drovakist 效率比 Qwertyist 高很多倍。

这个谜题需要一些语言理解来确定文本。是否存在类似第(3)点或以下oneliner的任何程序?

$ culturifyIt inputMe > outputYouIwillDetectAutomaticallyYourInputOutputLanguages

例子

“我是亨利。” >> 'Ich heiße Henry。(发芽)

“为 ett mojligt markkrig 重做 Tusentals solarter stor。” >> 'Tusentals soldater står redo för ett möjligt markkrig.' (瑞典化)

“约克。” >> 'Yöäk.' (修饰)

培养方法

  1. 键盘切换,慢。

  2. 特殊字符的特定组合键,例如变音 o、u 或 - 非常依赖于平台的解决方案,很容易出错。

  3. ...任何更自动化的方法可以检测语言然后对文本进行文化化?

0 投票
5 回答
6732 浏览

java - 实现押韵查找器

想知道是否有人有任何提示或可以指出正确的方向来查找/创建某种算法来查找押韵词。

我特别不想使用 API,因为创建算法只是为了创建它是我的最终目标。

并不是说它应该很重要,但我正在用 java 编码。

谢谢

0 投票
2 回答
303 浏览

html - 缩写标签中的大写还是小写?

由于HTML5 不支持Microsoft 的<acronym>标签,我们只需要使用 abbreviation 元素:

当谈到大写时,类似的情况很明显:它需要大写。

但是,在其他上下文中单词本身通常不大写的情况呢?

例如:

如果要切换标题和实际文本,那似乎很好。

但是当鼠标悬停时,它看起来有点奇怪:

首席技术官悬停

这同样适用于:

如果切换缩写和实际文本是有道理的,但悬停也看起来有点“奇怪”:

在此处输入图像描述

现在,如果我们将缩写词大写,就好像它们是标题一样呢?

例如:

如果 thetitle被替换为缩写,它会,但是在鼠标悬停时它看起来“更好”:

在此处输入图像描述

但什么是正确的语义?

0 投票
2 回答
5173 浏览

qt - 如何将 Qt Linguist 用于 Qt UI 文件?

我正在使用 Qt 语言学家翻译ui文件。我ts使用 获得了它的文件lupdate,并翻译了这些单词和短语。现在我想将它添加到我的代码中,但我从它的教程中发现似乎我必须添加tr()到我的代码中的每一个单词和短语中。我理解正确吗?我可以只加载翻译qm文件一次进行翻译吗?如果是这样,我该如何在这个ui文件中做到这一点?

提前致谢。

更新

在更改 Jens 提到的属性后,在我的 ui 头文件中,我可以看到如下语句:

在 Ajith 的回答之后,我更改了代码,现在我retranslateUiui_main.h文件中的函数如下所示:

但它仍然没有工作。

最近更新

我当前读取“.qm”文件的功能是这样的:

然后我这样调用这个函数:

在 Ajith 的最新回答之后,我以这种形式更改了警告/消息框的每个字符串(例如):

通过lupdate我可以读取所有这些字符串,翻译并将它们保存在一个 qm 文件中。现在的问题是,它可以将这些字符串转换为 ui,但不能在执行后转换为警告/消息框。