问题标签 [linguistics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
qt - Qt 语言学家为什么我不能更改默认翻译
我试图从 linguist 工具中打开一个默认的 ts 文件,并发现我无法编辑翻译,如果我已经安装了二进制文件。但是如果我自己构建了源代码,我就可以做到这一点。有人可以解释为什么会这样吗?
keyword - 从荷兰语短文本中提取关键字
我想从简短的荷兰语文本中提取关键字。是否有此 API 或我可以使用的某个库。
如果这些不适用于荷兰语,任何有关如何自己提取它们的提示也将不胜感激。我已经通过词性标注器和词形还原器运行文本自己尝试过。但从那时起,我发现很难提取出像样的关键字。TF-IDF 没有用,因为文本太短而无法获得好的结果。
我更喜欢 Java,但也非常欢迎任何其他语言实现。
linguistics - 有没有自动为短语/句子绘制树形结构的在线应用程序?
即,它将任何句子/短语作为输入并自动计算出树形图。
我正在寻找一种方法来查看我不确定如何绘制其树结构的句子/短语的树结构。
ios - 如何在 iOS 上生成英语句子的解析树?
我想在 iOS 应用程序中生成基于选区的英语句子解析树。 http://en.wikipedia.org/wiki/Parse_tree
我目前的选择似乎是:
- 在 NSLinguisticTagger 的 POS 标记之上编写我自己的树生成。
- 将基于 python 的 NLTK 嵌入到我的应用程序中。
- 创建或使用基于服务器的方法。
任何人都可以推荐其中一种方法,或者建议另一种方法吗?
nlp - 如何将文本修剪成一定长度的完整句子?
我正在寻找一种将未知文本修剪到一定长度的解决方案。只保留完整的句子。
所以像这样的文字
应该变成
字符限制为 50、40(和 20 与 --find-next-sentence-ending)。
我读过很多 SO question - 大多数答案都是
但这显然不适用于上述句子和其他类似句子。其他人建议使用斯坦福文本解析器或 OpenNLP。它们真的很酷,但不适用于典型应用。您不会在 Ruby/PHP 服务器上安装 Java,只是为了修剪文本,对吧。所以我正在寻找一些 80/20 的解决方案,它与语言无关,并且能够处理出现的典型案例。
我想不出比这更有问题的句子(在下一个句子的开头包含日期、非点句结尾和非 ascii 字符,以及“限制”句中间的非结尾点)。
我还创建了一个 GIST (https://gist.github.com/4051035) 供您分叉和玩 - 分叉确保用户可以点击此问题的不同解决方案,所以请使用它;) 我想提出这个问题comunity-wiki,但它似乎不适用于问题 - 仅用于答案。因此,请在评论中添加任何建议/相关的 SO 问题。谢谢。
cryptography - 如何识别单词是否没有意义,也许是一些不可能的音节?
最初,我有m个包含n 个字符的数组,其中每个数组包含所需单词的未知(对我而言)字符(条件:单词有意义)。
例如m =4,n =3:array0={' t ',' e ',' c ' },array1={' g''o''a ' } , array2= { ' w''d ' ' y '}, array3 = {'e''o ' 's ' }。每个数组只包含一个正确的字母:在array0中是第一个字母,在array1中-第二个......所以,可能的秘密词是' code ':array0[2] =' c ',array1[1] =' o ',数组2[1] = '
我需要找到所有现有的字母组合,即排除生成的无意义单词。英语中“不可能”的音节/字母组合是否有任何规则/规则?
我正在攻击 Vigenere 的密码。所以,我知道密钥的长度及其可能的字符。我正在改组我的数组并得到许多无意义的单词。问题是过滤它们。据我了解,某些条件可以帮助识别错误的单词。例如,如果字长 > 4,则所有元音字符或所有辅音字符都是错误的。某些音节,例如kk *hh* ww,一般来说也是不可能的。我在哪里可以找到这样的规则?
keyboard - 与语言无关的键盘:用英语培养中性文本 -kbd 没有变音符号之类的东西?
我喜欢在编程时使用美国德沃夏克国际键盘——每本手册、每份文档,也可以使用它进行编程。我把我的老师逼疯了,因为他们时不时地要求我用不同的语言写东西,比如德语、芬兰语、瑞典语或挪威语。我的成绩往往会愚蠢地下降,因为我懒得换键盘,错过了变音符号等奇怪的东西。我发现键盘切换速度很慢,而且我现在的 Drovakist 效率比 Qwertyist 高很多倍。
这个谜题需要一些语言理解来确定文本。是否存在类似第(3)点或以下oneliner的任何程序?
$ culturifyIt inputMe > outputYouIwillDetectAutomaticallyYourInputOutputLanguages
例子
“我是亨利。” >> 'Ich heiße Henry。(发芽)
“为 ett mojligt markkrig 重做 Tusentals solarter stor。” >> 'Tusentals soldater står redo för ett möjligt markkrig.' (瑞典化)
“约克。” >> 'Yöäk.' (修饰)
培养方法
键盘切换,慢。
特殊字符的特定组合键,例如变音 o、u 或 - 非常依赖于平台的解决方案,很容易出错。
...任何更自动化的方法可以检测语言然后对文本进行文化化?
java - 实现押韵查找器
想知道是否有人有任何提示或可以指出正确的方向来查找/创建某种算法来查找押韵词。
我特别不想使用 API,因为创建算法只是为了创建它是我的最终目标。
并不是说它应该很重要,但我正在用 java 编码。
谢谢
html - 缩写标签中的大写还是小写?
由于HTML5 不支持Microsoft 的<acronym>
标签,我们只需要使用 abbreviation 元素:
当谈到大写时,类似的情况很明显:它需要大写。
但是,在其他上下文中单词本身通常不大写的情况呢?
例如:
如果要切换标题和实际文本,那似乎很好。
但是当鼠标悬停时,它看起来有点奇怪:
这同样适用于:
如果切换缩写和实际文本是有道理的,但悬停也看起来有点“奇怪”:
现在,如果我们将缩写词大写,就好像它们是标题一样呢?
例如:
如果 thetitle
被替换为缩写,它会,但是在鼠标悬停时它看起来“更好”:
但什么是正确的语义?
qt - 如何将 Qt Linguist 用于 Qt UI 文件?
我正在使用 Qt 语言学家翻译ui
文件。我ts
使用 获得了它的文件lupdate
,并翻译了这些单词和短语。现在我想将它添加到我的代码中,但我从它的教程中发现似乎我必须添加tr()
到我的代码中的每一个单词和短语中。我理解正确吗?我可以只加载翻译qm
文件一次进行翻译吗?如果是这样,我该如何在这个ui
文件中做到这一点?
提前致谢。
更新
在更改 Jens 提到的属性后,在我的 ui 头文件中,我可以看到如下语句:
在 Ajith 的回答之后,我更改了代码,现在我retranslateUi
在ui_main.h
文件中的函数如下所示:
但它仍然没有工作。
最近更新
我当前读取“.qm”文件的功能是这样的:
然后我这样调用这个函数:
在 Ajith 的最新回答之后,我以这种形式更改了警告/消息框的每个字符串(例如):
通过lupdate
我可以读取所有这些字符串,翻译并将它们保存在一个 qm 文件中。现在的问题是,它可以将这些字符串转换为 ui,但不能在执行后转换为警告/消息框。