1

我在一组 1400 条推文上成功构建并运行了 Syntaxnet。我很难理解解析文件中每个参数的含义。例如,我有一句话:

Shoutout @Aetna for covering my doctor visit. Love you!

解析的文件内容为:

1       Shoutout        _       NOUN    NNP     _       9       nsubj   _       _
2       @       _       ADP     IN      _       1       prep    _       _
3       Aetna   _       NOUN    NNP     _       2       pobj    _       _
4       for     _       ADP     IN      _       1       prep    _       _
5       covering        _       VERB    VBG     _       4       pcomp   _       _
6       my      _       PRON    PRP$    _       8       poss    _       _
7       doctor  _       NOUN    NN      _       8       nn      _       _
8       visit.  _       NOUN    NN      _       5       dobj    _       _
9       Love    _       VERB    VBP     _       0       ROOT    _       _
10      you     _       PRON    PRP     _       9       dobj    _       _
11      !       _       .       .       _       9       punct   _       _

每一列到底是什么意思?为什么除了 POS 标签之外还有空格和数字?

4

1 回答 1

1

这种类型的格式称为 CoNLL 格式。它有各种版本。这里描述了每一列的含义

于 2016-06-11T05:14:01.193 回答