问题标签 [stanford-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 使用标准 corenlp 包获取 corefrences
我正在尝试在文本中获得共同引用。我是 corenlp 包的新手。我尝试了下面的代码,但它不起作用,但我也对其他方法持开放态度。
这是我得到的错误:
java - 无法导入 edu.stanford.nlp - 有 jython 问题的斯坦福解析器
有人可以帮助我使用http://nlp.stanford.edu/software/lex-parser.shtml的 stanford 解析器吗?
我只下载并解压缩了解析器。我也完全安装了jython,但我无法解析一个句子,好像我已经安装了一些模块或其他东西。 http://wiki.python.org/jython/InstallationInstructions
除了解压并在jython中导入之外,还有没有更多的安装过程?
java - 斯坦福 POS 标注器在 Java 中的使用
这些是我想将 POS 标签分配给句子时遇到的错误。我从文件中读取句子。最初(对于几句话)我没有收到此错误(即无法标记),但在阅读了一些句子后会出现此错误。我使用 POS 标记器的 v2.0(即 2009),模型是left3words
.
java - 斯坦福解析 bash 脚本错误 - linux bash
有人可以帮我检查我的 bash 脚本吗?我正在尝试将 .txt 文件的目录提供给 stanford 解析器(http://nlp.stanford.edu/software/pos-tagger-faq.shtml),但我无法让它工作。我正在开发 ubuntu 10.10
循环正在工作并读取正确的文件:
但与
我收到此错误:
以下命令有效:
并输出这个
作为新加坡唯一一家国际知名的夜店,卡既是一城的公共机构,也是一城的一个公共机构,也是一个供成人礼等庆祝的不二场所。</p>
python - 在 python 中读取#char
有人可以帮我在 python 中阅读“#”字符吗?我似乎无法获取文件。因为这是 stanford postagger 的输出,是否有任何脚本可用于将 stanford postagger http://nlp.stanford.edu/software/tagger.shtml文件转换为 cwb。http://cogsci.uni-osnabrueck.de/~korpora/ws/CWBdoc/CWB_Encoding_Tutorial/node3.html
所以这是我要读取的 utf-8 txt 文件:
因此,使用此代码,我没有读取 utf-8 txt 文件中的 # 字符:
parsing - 斯坦福解析器的标记输入
谁能告诉我如何为斯坦福解析器提供我自己标记的输入句子?标记的句子是,比如说,
A/NN quick/JJ brown/JJ fox/NN
.
从他们的文档中,我发现标志 -tagSeparator /
应该可以工作,但我在这里很迷茫,我不知道如何在我的程序中使用这个标志。还是有什么其他方式?
请帮忙。
parsing - 斯坦福解析器:如何提取依赖关系?
我的工作包括在一个句子中找到一个查询(可以是noun+verb
),然后提取对象。
示例:"coding is sometimes a tough work."
我的查询是:"coding is"
.
我得到的类型依赖是:
我的程序应该提取 nsubj 依赖项,标识"coding"
为 query 并保存"work"
。
可能这看起来很简单,但直到现在,我还没有找到能够提取特定类型依赖的方法,我真的需要这个来完成我的工作。
欢迎任何帮助,
nlp - 如何使用 stanford nlp 解析器从 Collection tdl 中获取特定元素
我正在使用nlp parser stanord
. 我想从Collection
tdl 中提取一些元素,比如 nsubj 等等。我的代码是:
但我的问题是我不知道如何比较从集合中获得的元素。
非常感谢您的帮助!
stanford-nlp - 斯坦福解析器中 Penn TreeBank 和 PCFG 模型的用途
我对englishPCFG Model 和Penn treebank 注释的目的感到困惑,Standford Parser 的包只包含所有类型的模型,如果我们已经有来自Peen treebank 的注释,它总是问我这个模型是如何工作的。简单来说,Peen Treebank Annotation 对 Parser 有什么作用,Model 是怎么出来的?如果原始文本用于解析器,是否需要查询 Treebank 来预测树木?
我正在阅读一些材料,但仍然不知道在以下步骤中何时生成模型。1、选择一个可用的树库。2、选择适合treebank注解的解析器引擎。3、选择训练和测试数据。4、在训练集上训练解析器。5、评估解析器在测试集上的准确性。6、写项目报告,附实验结果。
有人可以帮忙吗?
nlp - CWB编码语料库
根据语料库工作台,要对语料库进行编码,我需要使用 cwb-encode perl 脚本
“对语料库进行编码,即使用 cwb-encode 工具将垂直化文本转换为 CWB 二进制格式。注意,下面的命令必须在一行中输入。” http://cogsci.uni-osnabrueck.de/~korpora/ws/CWBdoc/CWB_Encoding_Tutorial/node3.html
当我尝试它时,它说文件丢失但我确定文件在 $HOME/corpora/data/example 中,错误是
谁能弄清楚为什么?