0

我正在尝试执行一个分类程序,我的训练数据如下所示:

(状态,(feature_1,feature_2,feature_3,...,feature_n))

因此,给定一组特征,我需要预测这些特征最可能对应的状态/标签/类别。

我设置了很好的CRFSuite模型,可以非常快速地制作 CRF,但是 CRF 真的非常适合这种学习吗?我过去使用 CRF 来处理状态序列,即第 n 个状态的标签也可能取决于之前的 $n-1 个状态的标签/特征。例如,下面是一个训练序列,我用它来尝试在给定成人 IPA 转录的情况下预测孩子的语音输出:

e   Adult=e __BOS__
i   Adult=-
d   Adult=d
r   Adult=-
i   Adult=i
ə   Adult=-
n   Adult=- __EOS__

CRF 对这些数据有意义,因为音韵学/语音学非常有规律——选择什么声音会极大地影响未来的声音选择,例如元音后面可能会跟着一个辅音而不是另一个元音。

我(相信)理解 CRF 实际上只是 Maxent 模型的顺序形式。因此,如果我所有的训练序列总是长度为 1 美元,那么我基本上只有一个称为 CRF 的 Maxent 模型吗?

这个问题CRF for named entity recognition使用 CRF for named entity recognition 解决,但我猜它使用状态序列?

4

1 回答 1

0

出于这个目的,我认为最简单的 CRF 是逻辑回归,一个判别分类器可以完成这项工作。您的要求与命名实体不同,因为没有状态或观察链。它是简单的一种状态和有限的功能。我认为逻辑回归和偏差/方差权衡是要走的路。

于 2015-04-27T18:23:06.757 回答