我正在尝试执行一个分类程序,我的训练数据如下所示:
(状态,(feature_1,feature_2,feature_3,...,feature_n))
因此,给定一组特征,我需要预测这些特征最可能对应的状态/标签/类别。
我设置了很好的CRFSuite模型,可以非常快速地制作 CRF,但是 CRF 真的非常适合这种学习吗?我过去使用 CRF 来处理状态序列,即第 n 个状态的标签也可能取决于之前的 $n-1 个状态的标签/特征。例如,下面是一个训练序列,我用它来尝试在给定成人 IPA 转录的情况下预测孩子的语音输出:
e Adult=e __BOS__
i Adult=-
d Adult=d
r Adult=-
i Adult=i
ə Adult=-
n Adult=- __EOS__
CRF 对这些数据有意义,因为音韵学/语音学非常有规律——选择什么声音会极大地影响未来的声音选择,例如元音后面可能会跟着一个辅音而不是另一个元音。
我(相信)理解 CRF 实际上只是 Maxent 模型的顺序形式。因此,如果我所有的训练序列总是长度为 1 美元,那么我基本上只有一个称为 CRF 的 Maxent 模型吗?
这个问题CRF for named entity recognition使用 CRF for named entity recognition 解决,但我猜它使用状态序列?