问题标签 [corenlp-server]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1230 浏览

stanford-nlp - 斯坦福 CoreNLP 服务器禁用日志记录

我觉得服务器的日志记录非常详尽。有没有办法禁用或减少日志输出?似乎如果我将文档发送到服务器,它将写入stdout可能成为性能杀手的内容。

我能以某种方式做到这一点吗?


更新

我找到了一种抑制服务器输出的方法。我的问题仍然是如何以及是否可以使用实际服务器的命令行参数来做到这一点。但是,对于一个肮脏的解决方法,似乎以下可以减轻开销。

运行服务器

哪里>/dev/null会将输出管道化。不幸的是,仅此一项并没有帮助。2&>1似乎在这里做的伎俩。我承认我不知道它实际上在做什么。但是,我比较了两次运行。

运行 2&>1 >/dev/null

在没有额外参数的情况下运行

这是一个非常肤浅的测试,但似乎这会产生相当大的影响。这里的差异是 1.828 倍,随着时间的推移,差异很大。

然而,这只是一个快速测试,我不能保证我的结果是完全正常的!

进一步更新:

我认为这与 JVM 如何随着时间的推移优化代码有关,但每个句子的时间与我在本地机器上的时间相当。请记住,我使用以下结果2&>1 >/dev/null来消除stdout日志记录。

0 投票
1 回答
1152 浏览

java - 设置我自己的斯坦福 CoreNLP 服务器时遇到的问题:

我正在按照http://stanfordnlp.github.io/CoreNLP/corenlp-server.html中的教程设置我自己的斯坦福解析器服务器。但是,当我粘贴示例代码时,会出现错误:

这是我的代码:

0 投票
2 回答
194 浏览

java - 斯坦福 CoreNLP:-nthreads 标志导致所有 ner 值为 O

我试图弄清楚为什么将-nthreads {int}参数添加到斯坦福 CoreNLP(版本stanford-corenlp-full-2015-12-09)会导致所有标记的输出 NER 值为 O(= 不是命名实体)。

举个简单的例子,创建一个名为的文件sample-file.txt,并使其内容为Samuel Huntington. 然后运行:

这将产生预期的输出,“Samuel”被识别为一个人:

但是,如果您添加-nthreads 8到上面的命令,输出并不表明 Samuel 是一个人。完整命令:

生成:

对于它的价值,-nthread {int}(即没有 s 的线程)解决了这个问题,所以我可以使用这个命令。我将把这个问题留在这里,以防其他人尝试使用 -nthreads 标志。

PS 这是我的 CLASSPATH(从 获得echo $CLASSPATH),其中仅包含我上周下载的 Stanford CoreNLP 发行版:/Users/dduhaime/Desktop/everett/wiki_facts/stanford-corenlp-full-2015-12-09/*:

0 投票
1 回答
367 浏览

nlp - 斯坦福 CORENLP 大师不断崩溃 (NullPointerException)

我从这个链接下载了最新版本的斯坦福 CoreNLP 和更大的英文模型

将下载的模型放在同一个项目文件夹中,我使用“ant”/“ant jar”来构建项目。

然后我在 Windows 上使用此命令加载服务器:

从http://localhost:9000加载结果页面,使用关系、共指等过滤器时服务器崩溃。

我得到错误:

来自服务器的日志:

一些注释失败,例如:

主要问题/异常:

任何可能导致此问题的帮助将不胜感激。

谢谢

0 投票
0 回答
352 浏览

stanford-nlp - 斯坦福 CoreNLP 服务器二进制解析树

我使用斯坦福 CoreNLP 服务器生成解析树 默认情况下,我得到的解析树不是二进制的。但是,我需要二叉解析树来构建递归神经张量网络。由于我的大部分代码都在 Python 中,因此我将包装器https://github.com/smilli/py-corenlp用于 CoreNLP Java 库。

到目前为止我尝试了什么:

  1. 在启动 CorNLP 服务器时设置 -binarize 参数:

    /li>
  2. 在发送发送到 CoreNLP 服务器的帖子“请求”时,添加 parse.binaryTree 参数并将其设置为 True

    /li>

尽管如此,我仍然收到非二进制解析树。

有谁知道该怎么做,以便 CoreNLP 服务器发回二叉解析树?谢谢你的帮助!

0 投票
1 回答
682 浏览

r - R:斯坦福 CoreNLP 为 getSentiment 返回 NA

我有以下文本数据:

我总是喜欢老派的家伙。我拥有科学博士学位。我真的没兴趣找有相同背景的人,否则生活会很无聊。

我正在尝试提取上述文本的情感分数,但我得到的都是 NA。

我不知道为什么会发生并用谷歌搜索,但没有找到任何相关的答案。同时,当我尝试 coreNLP 包中提供的示例数据时

它给了我一个答案,所以我不知道为什么会这样。如果有人能提供一些见解,将不胜感激。

0 投票
1 回答
2375 浏览

stanford-nlp - python - 如何从CoreNLP服务器返回的python字符串中获取解析树?

我将 pycorenlp 与 corenlp 服务器一起使用。我可以得到字符串格式的解析树。但是我可以像 NLTK 库那样把它当作一棵树吗?

输出:

0 投票
1 回答
1126 浏览

stanford-nlp - 如何将自定义 TokensRegex 规则注释器与斯坦福 CoreNLP 服务器一起使用?

TokensRegex 规则颜色注释器 ( stanford-corenlp-full-2016-10-31/tokensregex/color.rules.txt) 在通过命令行使用 CoreNLP 时成功加载,但对于带有 java.lang.IllegalArgumentException: Unknown annotator: color.

设置

命令行

服务器

  1. java -mx2g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -c custom.properties
  2. wget --post-data 'Both blue and light blue are nice colors.' 'localhost:9000/?properties={"annotators":"tokenize,ssplit,pos,lemma,ner,regexner,color","outputFormat":"json"}' -O -

    /li>

解决方案

在请求中包含自定义注释器属性:wget --post-data 'Both blue and light blue are nice colors.' 'localhost:9000/?properties={"color.rules":"tokensregex/color.rules.txt","customAnnotatorClass.color":"edu.stanford.nlp.pipeline.TokensRegexAnnotator","annotators":"tokenize,ssplit,pos,lemma,ner,regexner,color","enforceRequirements":"false","outputFormat":"json"}' -O -

0 投票
1 回答
588 浏览

nlp - 斯坦福 CoreNLP 服务器的 JSON 响应缺少 RelationExtractor 注释

我正在处理一个简单的句子来测试斯坦福大学的RelationExtractor

微软总部位于纽约。

(它不是)

当我在 Java 中注释句子时,通过直接使用 CoreNLP jar 文件,我得到了想要的结果 - CoreNLP在MicrosoftNew York之间找到了OrgBased_In关系。

但是,将相同的句子发送到CoreNLP 服务器,如下所示:

生成一个不包含任何关系数据的 json 响应:

我可以在 CoreNLP 服务器终端上看到加载了关系提取模型

我在这里想念什么?

谢谢!

0 投票
1 回答
611 浏览

stanford-nlp - CoreNLP 无法加载语言特定属性

我正在尝试让 Stanford CoreNLP 作为服务器正常运行(尽管问题可能会影响非服务器使用),但不断收到此错误:

"ERROR CoreNLP - Failure to load language specific properties".

它仍然可以工作,但它可能没有正常工作所需的一切。

我从基本下载开始。当我看到上述错误时,我下载并放置了英文模型jar和english-kbp模型jar在CoreNLP目录中。这两个很大,似乎与基本下载中的任何内容都不对应。但是,我仍然在重新启动服务器后收到上述错误。我也尝试添加

-serverProperties StanfordCoreNLP-english.properties

到命令行,但这给出了一个错误,说它无法读取属性文件。

有人知道我缺少什么吗?