问题标签 [word-sense-disambiguation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - sentiwordnet python中的词义消歧
我目前正在研究 Twitter 中的情绪分析。我想结合预定义的词典资源,如 sentiwordnet 极性分数。然后进行机器学习。问题是在得到sentiwordnet的正确分数上,以前的工作总是简单地通过词义的正负极性总分来选择。我的意思是,例如“mad”这个词可以出现 3 次否定词和 2 次肯定词。以前的大部分工作都会自动平均每个极性。所以我想在得到分数之前消除单词的歧义,这样我们就可以真正使用应该的 sentiwordnet。我在想通过比较目标句和光泽句的相似度..有什么方法可以比较它吗?你认为它会起作用吗?如果没有,请分享您的想法..
我对这个领域和新手python程序员完全陌生,所以我真的需要你的建议..谢谢..
nltk - 如何在 NLTK 的 senseval 模块中获得意义的定义?
在 NLTKsenseval
模块中,语义的形式HARD1
为 ,HARD2
等(参见此处的源代码)。但是,似乎没有办法获得实际定义。我正在尝试实现 Lesk 算法,现在我正在尝试检查 Lesk 算法预测的感觉是否正确(使用 WordNet 的定义)。
我遇到的问题是如何将 WordNet 定义与senseval
答案 ( HARD1
, HARD2
) 统一起来。有人知道如何将 SENSEVAL 意义翻译成定义,或者在某个地方查找吗?
similarity - 如何找到字符串相似度?
我正在研究关键字提取系统,在预置后,系统通过检查与相同模式匹配的文本来提取候选关键字
现在我想知道如何找到提取的候选关键词语义之间的相似性?例如,让我们看看下一个矩阵:
注意:关键字可以是1个字或更多
nlp - 你如何提取某个单词的各种含义
给定“暴力”作为输入,是否有可能想出一个人如何解释暴力(例如,身体暴力、一本书、一张专辑、一个音乐团体..),如下文参考文献#1 所述。
假设用户指的是专辑,那么从一组推文中寻找暴力作为专辑的最佳方式是什么。
有没有办法通过任何 NLP API 来推断这一点,比如 OpenNLP。
参考 #1
java - Senserelate 目标词:为最终用户提供“最佳”替代方案
我的问题介绍:用户可以搜索术语,RitaWordNet 提供了一个名为 getSenseIds() 的方法来获取相关的感官。到目前为止,我正在使用具有不同算法来定义距离的 WS4J(Java 的 WordNet 相似性, http://code.google.com/p/ws4j/ )。搜索“用户”有以下结果:
- 用户
- 剥削者
- 吸毒者
通过比较 WS4J 中的两个术语(我假设使用 targetWord?)来测量 Lin 距离:
- 之间的相似性:用户和:用户= 1.7976931348623157E308
- 相似度:用户和:explorer = 0.1976958835785797
我想向最终用户返回一个建议,即“用户”意义是最相关/正确的答案,但问题是这取决于句子的其余部分。
例如:“老人是公共交通工具的常客”,“年轻人在学习 NLP 时变成了吸毒者..”。
我假设 senserelate 项目包含我缺少的东西。在我的搜索过程中也找到了这个线程: word disambiguation algorithm (Lesk algorithm)
希望有人得到我的问题:)
perl - Perl Ubuntu WordNet::SenseRelate::AllWords - 安装过程中的相似性问题
如果这是向论坛发送垃圾邮件,那么我很抱歉,但我想为这个问题创建一个新线程,因为我现在在 Ubuntu 而不是 Windows 中工作(欢呼!)。链接到旧线程:Perl WordNet::Similarity 安装问题
这是我现在得到的错误:
有任何想法吗?谢谢
UPD:安装缺少的模块后得到这个:
测试摘要报告 - t/trace.t(Wstat:256 测试:132 失败:1)失败测试:76 非零退出状态:1 文件 = 22,测试 = 2027,88 挂钟秒(0.48 usr 0.05 sys + 85.34 cusr 2.23 csys = 88.10 CPU) 结果:FAIL 1/22 测试程序失败。1/2027 子测试失败。make: *** [test_dynamic] Error 255 TPEDERSE/WordNet-Similarity-2.05.tar.gz /usr/bin/make test -- NOT OK //hint// 要查看安装此模块的 cpan-testers 结果,请尝试: 报告 TPEDERSE/WordNet-Similarity-2.05.tar.gz 运行 make install make test 已返回错误状态,不会强制安装
java - Java:使用 Process() 调用 Perl 脚本:wsd.pl
我使用以下命令让终端与 SenseRelate::AllWords 一起工作:
但是,现在我正在尝试从我的 Java 代码运行 wsd.pl,它看起来像这样:
它给了我错误:
test.txt 路径是项目的源文件夹(顶层,在 src、.git 等旁边)
我尝试了一些不同的方法:将参数添加到列表并基于该列表创建一个新进程,格式化参数的不同方法,但不,它不起作用。有人可以帮忙吗?我想这是我不熟悉的一些语法。
谢谢!
python - 如何从给定的输入查询中找到多义词?
如果我的输入查询是:
“狗在树上吠叫”
这里的“树皮”一词是多义词,我们知道这一点。但是如何使用 wordnet 作为词法数据库通过 python 语言的代码来检查它呢?
nlp - 我希望创建一个系统,让我给出一个句子,系统会吐出与我给出的输入句子含义相似的句子
这是一个 NLP 问题,我想知道我应该如何进行。
问题有多难?我可以用同义词替换这个词并检查语法是否正确吗?
nlp - 词对词义消歧
假设我有一个单词 A 和一个单词 B,其中我使用 B 作为暗示,暗示 A 的含义。例如,A = bass,B = music,给定这个词对,作为人类我们可以立即知道什么A这个词是什么意思。
我知道有很多算法适用于句子。我想知道是否已经开发了仅针对一对单词进行 WSD 的算法。