0

我正在着手maltparser。我想申请所提供的

预训练模型 “engmalt.linear-1.7”进行解析

命令行上的英文句子。

我下载了engmalt并将其文件名从

'engmalt.linear-1.7. zip '到'engmalt.linear-1.7。行动管制令'。我

保存示例英文句子(在 engmalt 的下载页面上)

在“infile.conll”中并在命令行上运行。

我无法得到结果,并且出现了一个奇怪的错误

标签“FORM”没有可用的标签符号。

(顺便说一下,如果我测试 '/maltparser-

maltparser 的 1.7.1/examples/data/talbanken05_test.conll'

包,它可以惊人地获得依赖!)

  • Q1:我应该更改“engmalt.linear”的文件扩展名吗?

  • Q2:为什么我可以使用 engmalt 来解析 'talbanken05_test.conll'(不是

英文句子)?

  • Q3:为什么解析英文句子时会出错?是什么意思?

它的意思是?

非常感谢 !

4

1 回答 1

2

这是一个老问题,我不确定 OP 是否仍然需要答案。您应该与预训练模型一起使用的正确格式是此 xml 中定义的十列格式:

<?xml version="1.0" encoding="UTF-8"?>
<dataformat name="conllx">
    <column name="ID" category="INPUT" type="INTEGER"/>
    <column name="FORM" category="INPUT" type="STRING"/>
    <column name="LEMMA" category="INPUT" type="STRING"/>
    <column name="CPOSTAG" category="INPUT" type="STRING"/>
    <column name="POSTAG" category="INPUT" type="STRING"/>
    <column name="FEATS" category="INPUT" type="STRING"/>
    <column name="HEAD" category="HEAD" type="INTEGER"/>
    <column name="DEPREL" category="DEPENDENCY_EDGE_LABEL" type="STRING"/>
    <column name="PHEAD" category="IGNORE" type="INTEGER" default="_"/>
    <column name="PDEPREL" category="IGNORE" type="STRING" default="_"/>

</dataformat>
于 2014-11-07T01:34:59.673 回答