问题标签 [linguistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
31424 浏览

python - 用 Python 翻译人类语言

是否有用于将文本从一种人类语言翻译成另一种语言的 Python 模块?我打算使用要使用 Python 脚本进行预处理和后处理的文本。可以使用哪些其他 Python 集成方法?

0 投票
2 回答
515 浏览

arabic - 阿拉伯语标记语料库

请问有人知道免费的阿拉伯语标记语料库吗,因为我正在研究语法,我需要一个。
非常感谢。哈尼·阿尔穆斯利......

0 投票
4 回答
107 浏览

regex - 协助查找和替换正则表达式

我有一个文本文件,每一行的形式是:

TAB WORD TAB PoS TAB FREQ#

你们中的一个正则表达式向导会帮助我从文件中分离出单词吗?希望我会在 TextPad 中进行查找和替换,就是这样。多次查找和替换很好。一件事:注意搜索“动词”也会出现“动词”这个词,而不仅仅是词性,所以要小心。最后,我想以每行 1 个单词结束。

非常感谢!

0 投票
1 回答
346 浏览

database - 搜索实体名称数据库(大学、城市、人物、国家...)

对于我和另一个人正在开展的企业应用研究项目,我们希望从页面中删除某些内容以保持发布的消息的通用性(意味着不冒犯性并且本质上是匿名的)。现在我们想要获取用户在留言板上发布的消息,并删除任何类型的名称、学院或机构的名称以及亵渎(如果以后可能的话,我们希望删除企业名称)。

是否有一些我们可以连接到的数据库,我们可以运行清理我们的消息以检查数据库中的值以识别这些?

0 投票
2 回答
683 浏览

speech-recognition - 有没有在语音级别输出语音到文本的软件?

是否有任何软件能够获取音频文件并输出语音 (IPA) 文本?

我知道那里的大部分软件都将其直接转换为一种语言,但是有没有一种“可教”的软件?

0 投票
9 回答
956 浏览

regex - 脚本是否有一种相当简单的方法来判断(从上下文中)“她”是否是所有格代词?

我正在编写一个脚本来反转一段文本中的所有性别,所以所有的性别词都被交换了——“男人”与“女人”交换,“她”与“他”交换,等等。但有一个模棱两可的地方至于“her”应该换成“him”还是“his”。

0 投票
2 回答
1109 浏览

artificial-intelligence - 训练没有标记语料库数据的隐马尔可夫模型

对于语言学课程,我们使用隐马尔可夫模型实现了词性 (POS) 标记,其中隐变量是词性。我们在一些标记数据上对系统进行了训练,然后对其进行了测试,并将我们的结果与黄金数据进行了比较。

是否可以在没有标记训练集的情况下训练 HMM?

0 投票
3 回答
1408 浏览

ruby - 红宝石语言学宝石

我尝试将数字转换为单词,但我遇到了问题:

我希望它是“九十一点八十”。我使用语言学宝石。你知道一些解决方案吗(更喜欢语言学)。

0 投票
3 回答
3390 浏览

java - 如何获得名词的所有格形式?

这是一个给给定输入名词添加撇号的算法。

你将如何构造一个字符串来显示所有权?

0 投票
3 回答
471 浏览

oop - 一个句子由什么组成?如何命名?

我正在设计文本解析器的架构。例句:Content here, content here.

整个句子是一个……句子,这很明显。Thequick是单词;,.是标点符号。但是一般来说,单词和标点符号是什么?它们只是符号吗?我根本不知道如何以最合理的抽象方式命名一个句子包含的内容(因为可能会写它由字母/元音等组成)。

谢谢你的帮助 :)