问题标签 [wordnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5397 浏览

nlp - 查找与特定单词相关的单词(特别是物理对象)

我正在尝试查找与单个单词相关的单词(特别是物理对象)。例如:

网球:网球拍、网球、网球鞋

斯诺克:斯诺克球杆、斯诺克球、粉笔

国际象棋:棋盘、棋子

书柜:书

我曾尝试使用 WordNet,特别是 meronym 语义关系;但是,这种方法并不一致,如下结果所示:

网球:发球、截击、脚误、设定点、回球、优势

斯诺克没什么

国际象棋:国际象棋移动,棋盘(其自身的meronym关系显示“正方形”和“对角线”)

书柜:搁板

最终将需要对术语进行加权,但现在这并不是一个真正的问题。

有人对如何做到这一点有任何建议吗?


只是更新:最终混合使用了 Jeff 和 StompChicken 的答案。

从 Wikipedia 检索到的信息质量非常好,特别是如何(不出所料)有这么多相关信息(与一些不存在诸如“博客”和“ipod”之类的术语的语料库相比)。

维基百科的结果范围是最好的部分。该软件能够匹配以下术语(为简洁起见,列表被删减):

  • 高尔夫:[球、铁、发球台、球包、球杆]
  • 摄影:[相机,胶卷,照片,艺术,图像]
  • 钓鱼:[鱼,网,钩,陷阱,诱饵,诱饵,竿]

最大的问题是将某些词归类为物理人工制品;默认 WordNet 不是可靠的资源,因为其中不存在许多术语(例如“ipod”,甚至“蹦床”)。

0 投票
3 回答
1212 浏览

nlp - NLP 的 WordNet 代码

是否有任何代码可用于演示使用 Wordnet 进行自然语言处理?我的问题陈述是“开发一个查询回答系统。它将查询字符串作为输入。从用户正在阅读的文档中搜索令人兴奋的答案。它是一个桌面应用程序,文档已经保存。期望的输出是显示材料.

我是最后一年的学生。在 2009 年 3 月 15 日之前等待您的回复。问候, Farheena Jawed

0 投票
1 回答
2214 浏览

prolog - 如何在 Prolog 中进行大小写转换?

我正在与WordNet交互,我想分类的一些术语(各种专有名称)在数据库中大写,但我得到的输入可能没有正确大写。我最初的想法是编写一个谓词来产生输入的各种可能的大小写,但我不知道如何去做。

有谁知道如何解决这个问题,甚至更好,一种更有效的方式来实现我想做的事情?

0 投票
3 回答
410 浏览

sed - 仅显示和管道传输流中的特定文本行

这是使用 Wordnet 进行字典查找的命令行脚本:

我输入“你好”这是输出:

我只想要 S: 之后的字符串,之前什么都没有。我想删除以下内容:

将其自行留作管道->

0 投票
5 回答
2562 浏览

python - WordNet 有“级别”吗?(自然语言处理)

例如...

鸡是一种动物
墨西哥卷饼是一种食物

WordNet 允许您执行“is-a”...层次结构功能。

但是,我怎么知道什么时候停止爬树呢?我想要一个级别。
那是一致的。

例如,如果呈现一堆单词,我希望 wordNet 对所有单词进行分类,但在一定的级别上,所以它不会走得太远。将“墨西哥卷饼”归类为“事物”过于宽泛,而“墨西哥包裹食品”则过于具体。我想上升或下降..直到正确的水平。

0 投票
4 回答
7674 浏览

java - 用 WordNet 检测专有名词?

我正在使用JAWS访问WordNet。给定一个单词,有没有办法检测它是否是专有名词?看起来同义词集具有相当粗略的词汇类别。

为了澄清,这些词没有上下文 - 它们只是单独呈现。如果可以想象一个词可以用作普通名词,那么它是可以接受的。所以“mark”很好,因为虽然它可以是某人的名字,但它也可以指一个点。然而,“非洲”不是。

0 投票
1 回答
1995 浏览

nlp - 西班牙语单词网

有没有类似于普林斯顿大学的西班牙语 WordNet 的东西?我需要找到西班牙语的同义词。

0 投票
1 回答
395 浏览

keyword - 如何根据关键字内容对网站进行分类

我正在编写一个 webrobot,它根据关键字/元/链接将网站分类到预定义的类别列表中。

我一直在研究各种本体方法,并研究了 Wordnet(对于上位词/下位词)、 ResearchCyc 、 WebKb,并且想知道这是否像我想的那样是一个难题,或者以前在其他地方已经解决了。

本质上,我有大量已排序的关键字值,并希望使用它们来匹配类别名称。我目前的想法是检查某种本体层次结构中的类别名称。

有没有其他人处理过这样的基于本体的问题?

干杯!

0 投票
2 回答
599 浏览

machine-learning - 意义层次

我正在寻找一种构建单词层次结构的方法。

背景:我是一名“业余”自然语言处理爱好者,现在我感兴趣的问题之一是从一组单词中确定单词语义的层次结构。

例如,如果我的集合包含其他人的“超级”表示,即

我有兴趣使用任何技术来提取“动物”这个词,该词对这个集合中的其他词具有最有意义和最准确的表示。

注意:它们的含义不同。猫!=狗!=猴子!=动物但猫是动物的子集,狗是动物的子集。

我知道现在你们中的很多人会告诉我使用 wordnet。好吧,我会尝试,但我实际上有兴趣做一个 WordNet 不适用的特定领域,因为:1)Wordnet 中找不到大多数单词 2)所有单词都是另一种语言;翻译是可能的,但效果有限。

另一个例子是:

所以功能包括这个集合中的所有东西。

我也尝试过爬取维基百科页面并在 td-idf 等上应用一些技术,但维基百科页面也没有真正做太多。

有人能告诉我我的研究应该朝着什么方向发展吗?(我可以使用任何东西)

0 投票
5 回答
2285 浏览

nlp - WORDNET 数据库访问

我已经下载了 wordnet(2.1) 但我不知道如何访问 wordnet 数据库?