问题标签 [opennlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2612 浏览

java - Issue Installing OpenNLP

I'm having an issue installing OpenNLP. I am hoping that the brilliance of the hive-mind of Stack can help me out here. I admit I'm not very familiar with using Java extensions/plug-ins, so any help would be greatly appreciated.

I have installed Maven. When I run mvn --version I receive the following:

When I go to the OpenNLP directory, /Users/[my_name]/apache-opennlp-1.5.2, and run mvn clean install, I receive this error:

I don't completely understand this error. If someone could explain what I need to do to fix it, I would really appreciate it.

Adam

0 投票
2 回答
186 浏览

java - Java:在 While 循环中嵌入 Equals 语句

我想知道是否有人可以向我解释下面的代码行是做什么的?

while((sample = samples.read()) != null)

它是否首先设置sample为等于 的下一行samples,然后检查以确保它不为空?

这是一个更普遍的问题,但如果有人有一个很好的 OpenNLP 教程,我也会非常感激。

这是整个方法:

public static Dictionary buildNGramDictionary(ObjectStream samples, int cutoff) throws IOException {

0 投票
1 回答
227 浏览

java - 使用 NLP 转换性别

基本上我正在编写一个 Java 模块,它应该采用英文文本并切换代词的性别。例如,如果你给它“她把盒子放在桌子上”,它会给你回“他把盒子放在桌子上”。如果你给它“他的脚受伤”,它会给你回“她的脚受伤”。

这很容易,除了“她的”这个词。有时他=她,有时他=她。

我一直在研究 NLP,对此我几乎一无所知,并且我尝试了 OpenNLP,但它让我失望了(由于许可问题,我无法使用 Standford NLP)。POS 标记器和 Chunker 会与她/她的混淆,解析器也是如此。例如:

盒子是他的。

盒子是她的。

盒子是他的盒子。

那个盒子就是她的盒子。

它正确地将“hers”识别为形容词短语,但是当以完全相同的方式在谓词中使用“his”时,它错误地将其识别为所有格代词,就好像它在修饰某些名词一样,如第三个和第四个示例..

这只是训练集的问题吗?是否有可能创建我自己的训练集来做得更好,基本上是一个只有他/她的大量句子的集?

如果您能告诉我是否有任何方法可以使用 NLP 来确定代词的先行词,则可以加分。例如:

我的猜测是这几乎是不可能的,因为这对人类来说有时甚至很难。

0 投票
1 回答
1111 浏览

java - 如何使用 OpenNLP 实现阿尔巴尼亚语的命名实体识别?

我正在尝试阿尔巴尼亚语的 OpenNLP。为此,我正在使用 OPenNLP 并尝试为阿尔巴尼亚语的人员、位置和组织实体识别构建模型。我正在构建我自己的语料库,但我需要一位 Open NLP 专家来确认我以下疑问: 1- 我是否应该为每个模型构建一个单独的语料库,例如为 ner-person 构建一个只有标签存在的语料库?2-是否可以在同一语料库中标记人员、位置和组织,并使用它来训练能够提取所有三种实体类型的单个模型?3-是否有资源可以让我找到更多关于 OpenNLP 名称查找器模块中使用的算法的信息?

感谢您的回复,我真的需要您对我的论文的支持

0 投票
1 回答
1881 浏览

java - OpenNLP Namefinder API 中的自定义特征生成

我正在尝试将 OpenNLP 的自定义功能生成用于 Named Finder API。

http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html

我浏览了文档,但无法理解如何指定不同的功能。

它只是说:

但是您如何实际使用这些不同的特征生成器来创建我自己的自定义特征。有人可以发布一个定义这些特征生成器的示例代码,以及我们如何使用它来生成自定义特征。感谢期待。

0 投票
1 回答
849 浏览

java - 如何训练 POSTagger OpenNLP 并将结果附加回旧模型?

所以,我正在尝试使用 POSTagger 的培训 API。但我想将新的训练数据附加到旧模型中。或者,如果我想多次训练它,我会有很多模型文件。我如何将结果组合回现有模型。所以,我只有一个数据更大的模型。我认为模型文件是一个二进制文件,所以我不确定在这种情况下附加文件是否可以工作。

这是我的代码

0 投票
1 回答
1780 浏览

text - NLP - 句子的主题

我试图得到一个句子的主要主题,即一个句子在说什么(不是可能不同的语法主题)。

到目前为止,我得到了

1.) Java 中的 OpenNLP,它为我提供了句子检测、POS 标记、解析、标记器和名称查找器。

2.) MatlParser,stanford Parser - 它可以通过依存解析给出一个简单句子的语法主语。

我认为名词或名词短语在更一般的意义上总是主语,但一个句子可以有很多名词和名词短语。任何帮助将非常感激。

0 投票
1 回答
2345 浏览

java - 整个文本文件的 OpenNLP 句子检测 API

这是单个字符串的 OpenNLP Sentence Detector API 的代码:

现在我的问题是如何传递整个文本文件并执行句子检测而不是单个字符串?

0 投票
1 回答
601 浏览

java - 0.0.0-SNAPSHOT 不支持 OpenNLP 模型版本 1.5.0

我正在尝试使用 OpenNLP 尝试手册中的示例(第一次使用它)。

出于某种原因:

得到一个错误:

我一点也不知道为什么会发生这种情况......它在这里说 0.0.0-SNAPSHOT 版本的 OpenNLP 永远不会无法加载任何模型。

到目前为止,我无法找到有关此错误的任何其他信息。这可能是我对进口所做的事情?还是我正在使用的模型(我从 OpenNLP 网站下载的 --- 找不到任何其他版本)?无论如何,我不知道出了什么问题......

任何想法或帮助将不胜感激。

附加信息:我在 Ubuntu 12.04 上使用 OpenNLP 1.5.2 孵化和 1.5 模型(项目网站说它应该完全兼容)。而且我不确定这是否有任何意义,但我正在使用 Eclipse Indigo。

0 投票
2 回答
393 浏览

java - 为什么 opennlp 库的 HelloWorld 在 Java 上运行良好,但在 Jruby 上却不行?

我收到此错误:

HelloWorld.rb 是:

跑步时ruby HelloWorld.rb "I am trying to make it work"

当我运行它时,HelloWorld.java "I am trying to make it work"它工作得很好,当然.java不包含该require java语句。

编辑:

我按照以下步骤操作

的输出jruby -v