问题标签 [linguistics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 用 Python 翻译人类语言
是否有用于将文本从一种人类语言翻译成另一种语言的 Python 模块?我打算使用要使用 Python 脚本进行预处理和后处理的文本。可以使用哪些其他 Python 集成方法?
arabic - 阿拉伯语标记语料库
请问有人知道免费的阿拉伯语标记语料库吗,因为我正在研究语法,我需要一个。
非常感谢。哈尼·阿尔穆斯利......
regex - 协助查找和替换正则表达式
我有一个文本文件,每一行的形式是:
TAB WORD TAB PoS TAB FREQ#
你们中的一个正则表达式向导会帮助我从文件中分离出单词吗?希望我会在 TextPad 中进行查找和替换,就是这样。多次查找和替换很好。一件事:注意搜索“动词”也会出现“动词”这个词,而不仅仅是词性,所以要小心。最后,我想以每行 1 个单词结束。
非常感谢!
database - 搜索实体名称数据库(大学、城市、人物、国家...)
对于我和另一个人正在开展的企业应用研究项目,我们希望从页面中删除某些内容以保持发布的消息的通用性(意味着不冒犯性并且本质上是匿名的)。现在我们想要获取用户在留言板上发布的消息,并删除任何类型的名称、学院或机构的名称以及亵渎(如果以后可能的话,我们希望删除企业名称)。
是否有一些我们可以连接到的数据库,我们可以运行清理我们的消息以检查数据库中的值以识别这些?
speech-recognition - 有没有在语音级别输出语音到文本的软件?
是否有任何软件能够获取音频文件并输出语音 (IPA) 文本?
我知道那里的大部分软件都将其直接转换为一种语言,但是有没有一种“可教”的软件?
regex - 脚本是否有一种相当简单的方法来判断(从上下文中)“她”是否是所有格代词?
我正在编写一个脚本来反转一段文本中的所有性别,所以所有的性别词都被交换了——“男人”与“女人”交换,“她”与“他”交换,等等。但有一个模棱两可的地方至于“her”应该换成“him”还是“his”。
artificial-intelligence - 训练没有标记语料库数据的隐马尔可夫模型
对于语言学课程,我们使用隐马尔可夫模型实现了词性 (POS) 标记,其中隐变量是词性。我们在一些标记数据上对系统进行了训练,然后对其进行了测试,并将我们的结果与黄金数据进行了比较。
是否可以在没有标记训练集的情况下训练 HMM?
ruby - 红宝石语言学宝石
我尝试将数字转换为单词,但我遇到了问题:
我希望它是“九十一点八十”。我使用语言学宝石。你知道一些解决方案吗(更喜欢语言学)。
java - 如何获得名词的所有格形式?
这是一个给给定输入名词添加撇号的算法。
你将如何构造一个字符串来显示所有权?
oop - 一个句子由什么组成?如何命名?
我正在设计文本解析器的架构。例句:Content here, content here.
整个句子是一个……句子,这很明显。The
等quick
是单词;,
和 .
是标点符号。但是一般来说,单词和标点符号是什么?它们只是符号吗?我根本不知道如何以最合理的抽象方式命名一个句子包含的内容(因为可能会写它由字母/元音等组成)。
谢谢你的帮助 :)