0

我是数据到文本 NLG 的新手。我正在研究数据到文本中的语义对齐,任务定义是用数据表的键标记关于数据故事的参考文本段,如下图所示。

数据到文本

现在的困难是没有标记数据,所以我不知道如何处理它。所以我想知道有没有关于这个问题的论文或方法。谢谢!

4

1 回答 1

0

这是文本的语言特征,称为词性标注。你应该从 spaCy 开始,下面是理解它的代码:

import spacy

nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")

for token in doc:
    print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,
            token.shape_, token.is_alpha, token.is_stop)

输出将是:

Apple Apple PROPN NNP nsubj Xxxxx True False
is be AUX VBZ aux xx True True
looking look VERB VBG ROOT xxxx True False
at at ADP IN prep xx True True
buying buy VERB VBG pcomp xxxx True False
U.K. U.K. PROPN NNP compound X.X. False False
startup startup NOUN NN dobj xxxx True False
for for ADP IN prep xxx True True
$ $ SYM $ quantmod $ False False
1 1 NUM CD compound d False False
billion billion NUM CD pobj xxxx True False

如需详细了解 - https://spacy.io/usage/linguistic-features

于 2020-10-01T09:14:05.500 回答