问题标签 [stanford-nlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2912 浏览

java - 使用标准 corenlp 包获取 corefrences

我正在尝试在文本中获得共同引用。我是 corenlp 包的新手。我尝试了下面的代码,但它不起作用,但我也对其他方法持开放态度。

这是我得到的错误:

0 投票
2 回答
1253 浏览

java - 无法导入 edu.stanford.nlp - 有 jython 问题的斯坦福解析器

有人可以帮助我使用http://nlp.stanford.edu/software/lex-parser.shtml的 stanford 解析器吗?

我只下载并解压缩了解析器。我也完全安装了jython,但我无法解析一个句子,好像我已经安装了一些模块或其他东西。 http://wiki.python.org/jython/InstallationInstructions

除了解压并在jython中导入之外,还有没有更多的安装过程?

0 投票
4 回答
6242 浏览

java - 斯坦福 POS 标注器在 Java 中的使用

这些是我想将 POS 标签分配给句子时遇到的错误。我从文件中读取句子。最初(对于几句话)我没有收到此错误(即无法标记),但在阅读了一些句子后会出现此错误。我使用 POS 标记器的 v2.0(即 2009),模型是left3words.

0 投票
3 回答
898 浏览

java - 斯坦福解析 bash 脚本错误 - linux bash

有人可以帮我检查我的 bash 脚本吗?我正在尝试将 .txt 文件的目录提供给 stanford 解析器(http://nlp.stanford.edu/software/pos-tagger-faq.shtml),但我无法让它工作。我正在开发 ubuntu 10.10

循环正在工作并读取正确的文件:

但与

我收到此错误:

以下命令有效:

并输出这个

作为新加坡唯一一家国际知名的夜店,卡既是一城的公共机构,也是一城的一个公共机构,也是一个供成人礼等庆祝的不二场所。</p>

0 投票
2 回答
318 浏览

python - 在 python 中读取#char

有人可以帮我在 python 中阅读“#”字符吗?我似乎无法获取文件。因为这是 stanford postagger 的输出,是否有任何脚本可用于将 stanford postagger http://nlp.stanford.edu/software/tagger.shtml文件转换为 cwb。http://cogsci.uni-osnabrueck.de/~korpora/ws/CWBdoc/CWB_Encoding_Tutorial/node3.html

所以这是我要读取的 utf-8 txt 文件:

因此,使用此代码,我没有读取 utf-8 txt 文件中的 # 字符:

0 投票
1 回答
594 浏览

parsing - 斯坦福解析器的标记输入

谁能告诉我如何为斯坦福解析器提供我自己标记的输入句子?标记的句子是,比如说,

A/NN quick/JJ brown/JJ fox/NN

.

从他们的文档中,我发现标志 -tagSeparator /应该可以工作,但我在这里很迷茫,我不知道如何在我的程序中使用这个标志。还是有什么其他方式?

请帮忙。

0 投票
2 回答
7311 浏览

parsing - 斯坦福解析器:如何提取依赖关系?

我的工作包括在一个句子中找到一个查询(可以是noun+verb),然后提取对象。

示例:"coding is sometimes a tough work."我的查询是:"coding is".

我得到的类型依赖是:

我的程序应该提取 nsubj 依赖项,标识"coding"为 query 并保存"work"

可能这看起来很简单,但直到现在,我还没有找到能够提取特定类型依赖的方法,我真的需要这个来完成我的工作。

欢迎任何帮助,

0 投票
1 回答
469 浏览

nlp - 如何使用 stanford nlp 解析器从 Collection tdl 中获取特定元素

我正在使用nlp parser stanord. 我想从Collectiontdl 中提取一些元素,比如 nsubj 等等。我的代码是:

但我的问题是我不知道如何比较从集合中获得的元素。

非常感谢您的帮助!

0 投票
1 回答
636 浏览

stanford-nlp - 斯坦福解析器中 Penn TreeBank 和 PCFG 模型的用途

我对englishPCFG Model 和Penn treebank 注释的目的感到困惑,Standford Parser 的包只包含所有类型的模型,如果我们已经有来自Peen treebank 的注释,它总是问我这个模型是如何工作的。简单来说,Peen Treebank Annotation 对 Parser 有什么作用,Model 是怎么出来的?如果原始文本用于解析器,是否需要查询 Treebank 来预测树木?

我正在阅读一些材料,但仍然不知道在以下步骤中何时生成模型。1、选择一个可用的树库。2、选择适合treebank注解的解析器引擎。3、选择训练和测试数据。4、在训练集上训练解析器。5、评估解析器在测试集上的准确性。6、写项目报告,附实验结果。

有人可以帮忙吗?

0 投票
1 回答
469 浏览

nlp - CWB编码语料库

根据语料库工作台,要对语料库进行编码,我需要使用 cwb-encode perl 脚本

“对语料库进行编码,即使用 cwb-encode 工具将垂直化文本转换为 CWB 二进制格式。注意,下面的命令必须在一行中输入。” http://cogsci.uni-osnabrueck.de/~korpora/ws/CWBdoc/CWB_Encoding_Tutorial/node3.html

当我尝试它时,它说文件丢失但我确定文件在 $HOME/corpora/data/example 中,错误是

谁能弄清楚为什么?