我正在学习语义角色标签 (SRL) 任务。我已经阅读了很多,现在我遇到了如何将文本特征表示为向量的问题。
例如,对于句子:
We like StackOverflow very much
给定谓词动词: like
,一些特征是:
the left 1st word: I
the right 1st word: StackOverflow
the POS tag of the left 1st word: Pronoun
The POS tag of the right 1st word: Adverbial
将这些特征表示为向量的正确方法是什么?
如果可能的话,您能否也给我一些关于如何规范化这些功能的指导?
我基本上想使用SVM
模型来训练具有这些类型特征的数据。