0

我正在学习语义角色标签 (SRL) 任务。我已经阅读了很多,现在我遇到了如何将文本特征表示为向量的问题。

例如,对于句子:

We like StackOverflow very much

给定谓词动词: like,一些特征是:

the left 1st word: I
the right 1st word: StackOverflow
the POS tag of the left 1st word: Pronoun
The POS tag of the right 1st word: Adverbial

将这些特征表示为向量的正确方法是什么?

如果可能的话,您能否也给我一些关于如何规范化这些功能的指导?

我基本上想使用SVM模型来训练具有这些类型特征的数据。

4

1 回答 1

1

无论您使用什么分类器(SVM 与否),文本的特征生成都是相同的。我建议你看看这个: 二进制特征提取

这个库也会让你的生活更轻松: http ://cogcomp.cs.illinois.edu/page/software_view/LBJ 教程在这里:http ://cogcomp.cs.illinois.edu/page/tutorial.201310

于 2014-11-04T07:10:22.343 回答