问题标签 [hypernym]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何获得在 ntlk wordnet 中共享特定最低常见上位词的所有下位词?
鉴于有一条从两个常见同义词集到获得最低共同上位词的路径,似乎应该有某种方式回溯并找到导致该上位词的下位词
python - 不同的 Nltk,需要 wordnet 上位词输出
当我尝试打印上位词时,我只想要这个词而不是关于这个词的所有信息。
我的输出是 [Synset('change.v.02')]。我只想“改变”。我需要做什么改变?对不起,我是 wordnet 的新手。
r - 如何在 R 中使用 wordnet 获取单词层次结构(例如,上位词、下位词)
我想使用 R 中的 wordnet 包来获取单词层次结构,例如:“animal”是“cat”的上位词,“apple”是“fruit”的下位词。但是我可以从 R wordnet 帮助文件中找到的代码如下所示来识别反义词:
如何使用 R wordnet 包查找单词的上位词和下位词?
python - 如何从一组单词中自动识别上位词?
我有几组词,例如在A组中:苹果、梨、香蕉、水果、葡萄、西瓜;B组:猫、动物、狗、猪、猴、鸭;C组:意大利、澳大利亚、国家、中国、希腊。
如何自动识别这 3 组的上位词(例如,A 组的水果,B 组的动物和 C 组的国家)?非常感谢。
python - 在 WordsNet (Python) 中查找给定多个单词的最低共同上位词
如果我在 python 中有一个单词列表,例如:
有没有办法使用 WordNet 以编程方式为这组单词生成上位词?
r - R中文本数据的分类提取
我想对带有大量文本缩写的原始大型语料库进行分类提取。
有一个名为taxize的 R 包。该软件包允许用户在许多分类数据源中搜索物种名称。
我的问题是:在文本中有很多缩写的情况下,是否可以使用taxize(或任何替代包)对文本数据进行分类提取?例如,我如何才能找到特定缩写词或概念的直系子代,该缩写词或概念在我的文本数据中很常见,但未在分类数据源(如“ncbi”和“itis”)中列出。
感谢您的评论和回答。
谢谢,山姆
wordnet - 在某些情况下,同义词最相关的上位词
我有一句话说w。对于 w,我使用Lesk 算法来获取它应该属于的 synset s,因为我有一个上下文。现在对于这个同义词集 s,我想要所有上位词中的一个上位词,这样它在单词 w 的上下文中也是最相关的。在 python 中有这样的算法吗?
java - 我如何使用java获取多个单词的上位词
我想在 java 中使用 WordNet 字典获取多个单词的“上位词”。
**什么是上位词?**具有广泛含义的词构成具有更具体含义的词所属的类别;一个上级。例如,颜色是红色的上位词。
因此,如果我们有以下单词 1) 苹果
2) 香蕉
3) 肝炎
4) 树
5) 芒果
期望的输出是 感觉 1:
苹果:--(果皮红色或黄色或绿色,果肉甜到酸脆的白色果肉)
=> 可食用的水果——(种子植物的可食用生殖体,尤其是具有甜肉的植物)
=> 农产品、绿色商品、绿色杂货、园艺车——(为市场种植的新鲜水果和蔬菜)
=> 食物,固体食物——(任何用作营养来源的固体物质(与液体相反);“食物和饮料”)
=> 固体——(在常温常压下为固体的物质)
=> 物质,物质——(具有质量并占据空间的物质;“原子是最小的不可分割的物质单位”)
=> 物理实体--(具有物理存在的实体)
=> 实体 -- (被感知、已知或推断具有自己独特存在(有生命或无生命)的实体)
=> 果实——(种子植物成熟的生殖体)
=> 生殖结构——(植物参与其繁殖的部分)
=> 植物器官——(植物或真菌的功能和结构单位)
=> 植物部分,植物结构——(植物或真菌的任何部分)
=> 自然物体——(自然产生的物体;不是人造的)
=> 整体,单位——(被视为单个实体的部分组合;“与整体相比,该部分有多大?”;“团队是一个单位”)
=> object, physical object --(有形可见的实体;可以投下阴影的实体;“里面装满了球拍、球和其他物体”)
=> 物理实体--(具有物理存在的实体)
=> 实体 -- (被感知、已知或推断具有自己独特存在(有生命或无生命)的实体)
=> pome, false fruit -- (一种肉质水果(苹果或梨或相关水果),有种子室和外部肉质部分)
=> 果实——(种子植物成熟的生殖体)
=> 生殖结构——(植物参与其繁殖的部分)
=> 植物器官——(植物或真菌的功能和结构单位)
=> 植物部分,植物结构——(植物或真菌的任何部分)
=> 自然物体——(自然产生的物体;不是人造的)
=> 整体,单位——(被视为单个实体的部分组合;“与整体相比,该部分有多大?”;“团队是一个单位”)
=> object, physical object --(有形可见的实体;可以投下阴影的实体;“里面装满了球拍、球和其他物体”)
=> 物理实体--(具有物理存在的实体)
=> 实体 -- (被感知、已知或推断具有自己独特存在(有生命或无生命)的实体)
python - 一组词共享的最低常用上位词
给定一组 10 个单词 (["dog", "cat", "rabbit" .... ]),如果有的话,我想找到最低的常用上位词。
我知道 WordNet 可以让您在两个同义词集之间找到一个,但是在多个词中找到它的好方法是什么?
我的问题来自这样一个事实,每个单词都有一组 sysnet,其中这个集合的每个成员都可以有不同的上位词,每个上位词都有一组同义词,依此类推。所以一个简单的算法最终会做很多迭代。