问题标签 [opennlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opennlp - 命令行工具和使用 API(以编程方式)训练的模型之间有区别吗?
在 opennlp 中,我正在训练一个命名实体模型。如果我提供“.train”文件并使用命令行工具进行训练,它会完美运行。但是当我使用 API 并通过句子检测器并将其标记化并将其发送到 namefind 时,find 不会检测到类型。
java - 如何使用 Open NLP 提取名词短语
我是 Open NLP 的新手,在使用它提取名词短语时需要一些帮助。我生成了一个树结构,其中包含带有文本的 pos 标签。但是从树结构中我无法提取名词短语。这是我正在使用的代码:
这里p.show()
打印树结构,它不返回任何内容。我如何使用p.show()
来提取名词短语,或者有没有其他方法可以从树结构中获取它们?
请帮助我。
提前致谢
古斯。
r - mac上的openNLP
我不熟悉 Mac(我使用 Windows 和 Linux Mint),但我需要一个包,我需要能够告诉所有平台上的人们如何构建。该软件包依赖于openNLP
并且由于 MacOS X 的编码问题,因此无法通过install.packages("openNLP")
.
有人告诉我您仍然可以使用安装,install.packages("openNLP", type="source")
但我收到以下消息:
所以我使用 Mac 的终端来做建议R CMD javareconf
:
并尝试关闭 R,重新打开,然后install.packages("openNLP", type="source")
出现相同的消息。谷歌在这里没有帮助我,我对 Mac 非常不熟悉。我认为这与安装的 java 类型有关,但对 Mac 知之甚少,无法漫无目的地玩,因为这不是我的 Mac 机器。
请指导我正确安装 openNLP。
c# - 使用 OpenNLP 库在 C# 中创建 POSModel 对象
我正在使用 IKVM 工具在 .NET 中使用 C# 中的 OpenNLP 库。当我尝试创建一个对象时
它抛出这个错误:
无效格式异常
配置文件数据流的格式无效!
谁能告诉我上面的代码有什么问题?
sbt - SBT 对 opennlp-tools 的依赖
如果我有
在build.sbt
,我得到一个错误:
原因显然是https://issues.apache.org/jira/browse/OPENNLP-510,但将依赖替换为
(不包括 JWNL),如那里的评论中所建议的,仍然会产生相同的错误。有没有办法避免这个问题?
opennlp - opennlp chunker 和 postag 结果
Java-opennlp
我是 opennlp 的新手,我正在尝试分析句子并获得 post 标签和块结果,但我无法理解值的含义。是否有任何表格可以解释帖子标签和块结果值的完整形式含义?
nlp - Apache Stanbol 情绪分析和句子检测不起作用
我正在使用 Apache Stanbol。它适用于增强文本,但是当我尝试情绪分析和句子检测时,它不起作用。
我试过这段代码
但它给出了空白{ }
输出,我尝试更改标题属性但没有运气。
我错过了什么吗?我需要先做一些配置吗?
我什至尝试在增强器链中添加分析器,但相同的空白输出,也尝试了 REST API opennlp-sentence
,但它没有用。
opennlp - 使用 openNLP 识别命名实体(默认模型)
谁能指出 openNLP NameFinder 模块使用的算法?代码很复杂,而且文档很少,并且作为一个黑盒(提供默认模型)使用它给我的印象是它主要是启发式的。以下是输入和输出的一些示例:
输入:
约翰史密斯很沮丧。
约翰史密斯很沮丧。
巴拉克奥巴马很沮丧。
雨果查韦斯很沮丧。(不再)
杰夫阿特伍德很沮丧。
Bing Liu 对 openNLP NER 模块感到沮丧。
诺姆乔姆斯基对这个世界感到沮丧。
杰登史密斯很沮丧。
史密斯杰登很沮丧。
Lady Gaga 很沮丧。
Gaga 女士很沮丧。
Gaga 夫人很沮丧。
杰登很沮丧。
刘先生很沮丧。
输出(我将菱形改为方括号):
[START:person] John Smith [END] 很沮丧。
约翰史密斯很沮丧。
[START:person] Barak Obama [END] 很沮丧。
雨果查韦斯很沮丧。(不再)
[START:person] Jeff Atwood [END] 很沮丧。
Bing Liu 对 openNLP NER 模块感到沮丧。
[START:person] Noam Chomsky [END] 对这个世界感到沮丧。
Jayden [START:person] Smith [END] 很沮丧。
[START:person] Smith [END] [START:person] Jayden [END] 很沮丧。
Lady Gaga 很沮丧。
Gaga 女士很沮丧。
Gaga 夫人很沮丧。
杰登很沮丧。
刘先生很沮丧。
该模型似乎只是学习了在训练数据中注释的固定名称列表,并允许进行一些平铺和组合。两个值得注意的 (FN) 示例是:
- 忽略诸如 Mr. 和 Mrs. 之类的强姓名指示符。
- Jayden(2011 年美国最受欢迎的第 4 名)未被确定,而以下“Smith”(在“Jayden Smith...”中)被确定。我怀疑模型“认为”句子开头的大写 Jayden 是句子的开头而不是 NE。颠倒顺序,“Smith Jayden”作为提示(假设为 1),openNLP 将其识别为两个独特的 NE,与其他全名(例如“John Smith”)不同,可能暗示“Smith”在姓氏列表中。 .
-> 我感到困惑和沮丧,如果有人能指出我的算法(或验证它很糟糕),我将不胜感激。
ps 斯坦福和 UIUC NER 系统的性能要好得多,但存在一些有趣但偏离主题的细微差异(这个问题太长了)
text - NLP 寻找实体之间的关系
我目前的理解是,可以使用 OpenNLP、Stanford NLP 等工具包从文本文档中提取实体。
但是,有没有办法找到这些实体之间的关系?
例如考虑以下文本:
“你们有些人可能知道,我上周在欧洲高能物理实验室 CERN 度过,著名的希格斯玻色子在去年 7 月被发现。每次去 CERN,我都会感到深深的敬意。除了快速参观之外多年来,我在 1990 年代后期作为访问科学家在那里呆了三个月,从事早期宇宙物理学的研究,试图弄清楚如何将我们今天看到的宇宙与其婴儿期可能发生的事情联系起来。”
实体:我(作者)、欧洲核子研究中心、希格斯玻色子
关系: - 我“访问过”CERN - CERN“发现了”希格斯玻色子
谢谢。
java - Error in generatin parsing tree using Apache OpenNLP
Output : fetched from the file Exception in thread "main" java.lang.OutOfMemoryError: Java heap space....
while running this project in Netbeans ,I am getting this error i dont know what to do. I did exactly told on the OpenNLP site http://opennlp.apache.org/documentation/1.5.2-incubating/manual/opennlp.html#tools.parser .