问题标签 [wordnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2307 浏览

nlp - 如何使用 Wordnet 获取单词的变形

我想使用 Wordnet 获得单词的屈折形式。

例如,如果这个词是make,那么它的变形是

我尝试了wn命令的所有选项,但我没有得到一个单词的变形。

知道如何获得这些吗?

0 投票
1 回答
843 浏览

nlp - 搜索应用程序的同义词离线词典

我正在尝试构建一个智能搜索引擎应用程序,该应用程序获取问题中单词的同义词并使用每个生成的同义词查询我的数据库

问题是我正在寻找一种方法来使用字典或其他东西获取问题中单词的所有同义词。最终可以提供 1- 直接同义词,例如:文件 > 电影、足球 > 足球 2- 可以提供匹配字符串,例如:人口规模 > 公民数量(可选) 3- 快速可靠的东西。更喜欢离线托管而不是服务的 API

我探索了:

  • WordNet,但问题是它需要很多时间,因为它是在线使用的
  • Watson 同义词 效率不是很高,而且需要很多,(在线服务的 api)

我想知道是否还有其他有效的替代方案

0 投票
2 回答
1547 浏览

wordnet - Wordnet API 中的词干提取

我正在使用 MIT Wordnet API (http://projects.csail.mit.edu/jwi/) 在我的 Java 应用程序中使用 wordnet。我遇到以下问题:

如果我在http://wordnetweb.princeton.edu的 Wordnet 搜索中搜索“签名” ,我会得到“签名”作为形容词(例如签名书)和“签名”作为动词。完美的。

但是,当我使用 MIT API 时,我只会得到形容词。我知道这是由于词干,所以我使用 MIT API 中可用的 wordnet 词干分析器并获得“符号”。好的。然而,“符号”现在也可以是名词……事情可能会变得相当复杂。

有没有一种“简单”的方法可以通过 API 获得与 Wordnet Search Web 界面相同的结果?我不介意我是否使用其他 API。

谢谢!

Krt_马耳他

0 投票
1 回答
152 浏览

ruby - Ruby Wordnet Gem 中的错误/警告

我注意到 ruby​​ Wordnet gem 有很多错误/警告。

有人知道如何摆脱它们吗?或者是否正在积极维护 Wordnet gem?使用带有 Ruby 1.9.2 的 Wordnet gem 似乎也存在错误(我已经能够按照https://gist.github.com/1779371中的步骤绕过)

谢谢

0 投票
1 回答
1905 浏览

javascript - 如何通过 Javascript 查询 Prolog?

我正在使用 SWI-Prolog 查询 WordNet 数据库。我现在需要构建一个 HTML 界面,该界面将接受来自用户的单词并针对 db 查询它。

我如何编写一个 JS 代码,将单词发送到 Prolog 包装在查询中,以及如何检索有意义的变量中的结果,我可以在网页中显示回来?

0 投票
1 回答
838 浏览

windows - 在 r 中并行使用 wordnet(使用 Windows 7)

我正在尝试在 Windows 7 计算机上使用 R 的 wordnet 包进行并行处理。具体来说,我正在尝试查找名词列表的同义词。我在下面制作了一些示例代码来展示我正在尝试做的事情,但它似乎无法正确并行执行。它正在启动工人,它正在计算其中一个工人,而不是其他工人。我在下面制作的列表长度为 4,每个插槽中有 4 个单词。我试图将列表除以可用的核心数量,并将列表的一个子集发送到每个核心。然后 sapply 函数获取 4 个单词的同义词(在并行循环内)。我也尝试过使用 Snowfall 执行此操作,但无法导出字典(sfExport 似乎没有这样做)。我没有使用“.export” 在 foreach 循环中,因为它也给出了没有找到字典的错误,但是将它放在并行循环中似乎可以使它工作。任何帮助将非常感激。

0 投票
1 回答
977 浏览

python - 为什么 wordnet 中基于路径的相似性或任何相似性会在某些意义上给出 nan?

例如,采用两种感觉Synset('mile.n.03')Synset('support.v.09)当我计算这两种感觉之间基于路径的相似性时,如下所示

知道为什么会这样吗?还是我犯了一些根本性的错误?

0 投票
1 回答
1543 浏览

python - 在 Python NLP 中搜索整个系列的同义词集(来自 NLTK)

原始问题:

一个词的多义词是它所具有的意义的数量。使用 WordNet,我们可以通过 len(wn.synsets('dog', 'n')) 确定名词 dog 有七种含义。根据 WordNet 计算名词、动词、形容词和副词的平均多义词。

根据我从问题中收集到的信息,我将在 NLTK 中使用内置的多义方法和 WordNet 来找出某物具有的感官数量。

更重要的是,我正在尝试使用所有可用的同义词集并循环它们,并将所有返回的值放入一个集合中。在此之后,我打算添加新创建的集合(用整数填充)中所有同义词集的总数以接收总和。在我得到这个总和后,我会将条目总数除以得到平均值。

我最大的问题是……我将如何遍历所有可用的同义词以及名词、动词、形容词和副词?

  • 在通过各种网站进行研究后,我发现 for "wn.all_synsets('n')" 将返回所有可能的名词同义词集。

但是它返回的类型是“生成器”,我将如何使用循环来迭代“生成器”类型?

.>>>allsynsets = wn.all_synsets('n')

.>>> 所有同义词集

<.generator object all_synsets at 0x04359F30>

.>>> 类型(allsynsets)

<.type '生成器'>

我希望我已经提供了足够的信息,让任何人都能找到这个问题的答案。我没有源代码,除了导入和测试来理解这个问题的生成器类型。

感谢您的时间。

0 投票
1 回答
6597 浏览

machine-learning - 使用 Sentiwordnet 3.0

我计划使用 Sentiwordnet 3.0 进行情感分类。有人可以澄清与 Sentiwordnet 中的单词相关的数字代表什么吗?例如,排名#5 中的 5 是什么意思?同样对于 POS,用来表示副词的字母是什么?我假设'a'是形容词。我在他们的网站或其他网站上都找不到解释。

0 投票
1 回答
888 浏览

nlp - Wordnet 编辑树结构

我正在开发一个使用 Wordnet 概念层次结构进行操作的应用程序。我发现数据库中缺少一些我需要的单词。是否有 API 或工具,或者我可以插入新词、编辑结构等的任何其他方式?(我使用的是 Wordnet 3.0。)

谢谢。