问题标签 [malt-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
522 浏览

python - 与 nltk 一起使用时,malt 解析器给出断言错误

我正在使用带有 python nltk 的麦芽解析器。我已经成功下载了训练数据并更新了最新的 nltk。当我调用 malt 解析器时,它给了我一个断言错误。下面是来自 python 的代码,其中也包括回溯。

0 投票
0 回答
360 浏览

java - NLP 找到一个使用 conll 格式的程序

所以我在这里做一个项目我需要处理一个文本的信息。我使用了 opennlp 并尝试了 freeling,两者都得到了很好的结果(引理、除以句子、除以短语和 POS)。但后来我用这个 CONLL ( http://www.linguateca.pt/floresta/CoNLL-X/ ) 文件训练了 maltparser,malparser 使用的 POS 标签与 opennlp 和 freeling 不同。我知道这样做的一种方法是将 POS 标记形式转换为 opennlp(或 freeling)以被恶意解析器接受。我想知道是否有任何程序使用 CONLL 格式来训练他的算法,以便恶意解析器知道我得到的 POS 和引理。如果可能的话,可以在 Java 和 Windows 上运行的程序。

0 投票
0 回答
66 浏览

java - 解释 MaltParser 输出

我正在使用 MaltParser,我终于让它运行了,但现在我对输出有些怀疑。我收到的输出如下。

我的目标是了解单词是如何连接的我知道I: 0是句子的根,但我不明白另一个 id 是什么。我认为这 ** [O: 3] ** 表示它连接到词根和词 3 的单词 4 但我不明白1->4应该是什么意思。

我想知道的是,例如单词8,这是一个名字我想知道还有哪些其他单词与他直接相关。

谢谢

0 投票
1 回答
277 浏览

java - 关于训练 Maltparser 模型的问题

我正在尝试为孟加拉语训练 Maltparser 模型。我用 Conllu 格式注释了一个小型语料库。但它给了我空指针错误。所以我尝试了从 UD 网站收集的一些树库。它适用于这些数据集。我的问题是

  1. 我可以在没有 XPOSTAG 的情况下训练 Maltparser 模型吗,我已经注释了 UPOSTAG 字段,而 XPOSTAG 字段只是 UPOSTAG 的副本。我需要注释 XPOSTAG 吗?这是我的树库和 UD 树库之间的唯一区别

  2. 出于评估目的,我可以自动将 UPOSTAG 转换为 XPOSTAG 吗?

参考:http ://universaldependencies.org/format.html

为了更好地理解,我举了我的银行和 UD 银行的例子

我的示例银行(有错误和一些空白字段)(语言是孟加拉语)

UD银行

0 投票
1 回答
1346 浏览

python - 将文本句子转换为 CONLL 格式

我想将普通英文文本转换为 CONLL-U 格式供 maltparser 查找 Python 文本中的依赖项。我在java中试过但没有这样做,下面是我正在寻找的格式 -

我在java中尝试过,但我不能使用standford API,我想在python中也一样。

//这是java代码的例子,但是这里创建的令牌需要通过代码而不是手动解析-