问题标签 [dependency-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
601 浏览

python - 转换为带有 POS 标签的解析树

我使用pystatParser为一个英文句子生成每个解析树。示例输出(只是一个示例):

如何将每个输出转换为以下样式:

谢谢!

0 投票
3 回答
245 浏览

nlp - Parsey McParseface 错误地识别问题的根源

在我看来,Parsey 在正确标记问题和任何带有“is”的句子方面存在严重问题。


文本:巴拉克奥巴马是夏威夷人吗?

GCloud 代币(正确):

  • 是 - [根] 动词
  • 兵营 - [nn] 名词
  • 奥巴马 - [nsubj] 名词
  • 来自 - [adp] 准备
  • 夏威夷 - [pobj] 名词

Parsey 令牌(错误):

  • 是 - [警察] 动词
  • 兵营 - [nsubj] 名词
  • Obama - [词根] 名词
  • 来自 - [adp] 准备
  • 夏威夷 - [pobj] 名词

Parsey 决定将名词 (!) Obama 设为词根,这将其他一切都搞砸了。


文字:我的名字是菲利普

GCloud 代币(正确):

  • 我的 [poss] 代号
  • 名称 [nsubj] 名词
  • 是 [根] 动词
  • Philipp [attr] 名词

ParseyTokens(不正确):

  • 我的 [poss] 代号
  • 名称 [nsubj] 名词
  • 是 [警察] 动词
  • Philipp [词根] 名词

parsey 再次选择名词作为词根并与 COP 斗争。


任何想法为什么会发生这种情况以及我该如何解决?

谢谢,菲尔

0 投票
1 回答
2976 浏览

python - 将依赖解析的输出转换为树

我正在使用Stanford dependency parser并且我得到以下句子的输出

我在睡梦中射杀了一头大象

我想将其转换为一个图,其中节点是每个标记,边是它们之间的关系。

我需要图形结构进行进一步处理,因此如果修改它很容易并且必须易于表示,这将有所帮助。

到目前为止,这是我的代码。

如何制作这样的图结构?

0 投票
1 回答
114 浏览

python - 以编号格式转换斯坦福依赖项

我正在使用Stanford dependency parser并且我得到以下句子的输出

我在睡梦中射杀了一头大象

但是,我希望将编号标记作为输出,就像这里一样

到目前为止,这是我的代码。

我怎么会有这样的输出?

0 投票
0 回答
664 浏览

python-2.7 - 在 Python 上使用 NLTK 的斯坦福依赖解析器非常慢

我一直在使用斯坦福和 NLTK 进行依赖解析。我面临的问题是执行时间。这是上述代码的输出

每个句子/文本大约需要 4 秒。在java中,使用静态变量加载模块,速度超快。有什么建议么?按照这个速度,如果没有错误发生,我需要 100 个小时来训练!

0 投票
0 回答
556 浏览

python - 来自 CoNLL 输入的单词、POS 标记、关系的依赖关系树

我尝试使用NLTK DependencyGraph从 CoNLL 输入中获取依赖树。我的理解是,这个类提供了一个tree() method构建树结构的依赖关系,没有relationbetweenheaddependents。树也没有 POS 标签。还有一个三元组() method,它为头部、关系和依赖项提供 POS 标签。使用三元组方法,当一个词在句子中重复时,我很难得到依赖项,the red car is behind the blue car因为这个词的索引不在三元组中。在这里,对于同一个单词,我们有 2 个不同的节点car

那么如何从 CoNLL 输入一个带有头词、它的标签、关系、孩子的依赖树。它也可以是一个类似的数据结构,其中可以找到给定句子的信息(中心词、其标签、关系、子项)。欢迎提出任何建议。下面是一个可以用来启动的代码。

0 投票
1 回答
199 浏览

nlp - 如何将句法解析转换为依赖解析树?

使用链接语法,我可以对句子进行语法分析,如下所示:

问题在于 AFAIK 无法以编程方式理解该输出;似乎要走的路是将语法输出转换为依赖解析树,我该如何实现呢?

0 投票
0 回答
633 浏览

python - nltk stanford 依赖解析器抛出断言错误

我正在使用 python3 和 nltk 以及 stanford 依赖解析器来解析句子列表。然后用这句话收集所有节点信息。以下是我的代码,它在 python3 和一个名为 .python 的 virtualenv 环境中执行:

我发现 stanford 依赖解析器在某些句子中不断抛出断言错误。这是我得到的错误:

然后我找到了导致这个错误的句子。这是 :

我多次更改句子以查看触发断言错误的原因。似乎当我从中删除“/”时,可以解析该句子。当我在其中包含“/”时,会引发断言错误。

我想知道是否有导致问题的特殊符号。我回到 nltk 的源代码以检查导致此断言错误的原因(在网站中搜索“assert”:http ://www.nltk.org/_modules/nltk/parse/dependencygraph.html )但无法弄清楚是什么导致错误。

谁能解释为什么会抛出错误以及如何解决?

0 投票
0 回答
91 浏览

nltk - StanfordDependencyParser 以德语将所有标签返回为 NULL

我正在尝试让 NLTK 中的 StanfordDependencyParser 与德语一起运行。

我可以生成一棵树,但所有依赖项都标记为 NULL。

我究竟做错了什么?它在切换到英语时有效。德语不支持依赖解析吗?

0 投票
1 回答
198 浏览

machine-learning - 训练 SyntaxNet 需要多少数据?

我知道数据越多越好,但是训练 SyntaxNet 所需的合理数据量是多少?