machine-learning - 训练序列长度为 1 的条件随机场是否只是 Maxent 模型？

Question

我正在尝试执行一个分类程序，我的训练数据如下所示：

（状态，（feature_1，feature_2，feature_3，...，feature_n））

因此，给定一组特征，我需要预测这些特征最可能对应的状态/标签/类别。

我设置了很好的CRFSuite模型，可以非常快速地制作 CRF，但是 CRF 真的非常适合这种学习吗？我过去使用 CRF 来处理状态序列，即第 n 个状态的标签也可能取决于之前的 $n-1 个状态的标签/特征。例如，下面是一个训练序列，我用它来尝试在给定成人 IPA 转录的情况下预测孩子的语音输出：

e   Adult=e __BOS__
i   Adult=-
d   Adult=d
r   Adult=-
i   Adult=i
ə   Adult=-
n   Adult=- __EOS__

CRF 对这些数据有意义，因为音韵学/语音学非常有规律——选择什么声音会极大地影响未来的声音选择，例如元音后面可能会跟着一个辅音而不是另一个元音。

我（相信）理解 CRF 实际上只是 Maxent 模型的顺序形式。因此，如果我所有的训练序列总是长度为 1 美元，那么我基本上只有一个称为 CRF 的 Maxent 模型吗？

这个问题CRF for named entity recognition使用 CRF for named entity recognition 解决，但我猜它使用状态序列？

score 0 · Accepted Answer

出于这个目的，我认为最简单的 CRF 是逻辑回归，一个判别分类器可以完成这项工作。您的要求与命名实体不同，因为没有状态或观察链。它是简单的一种状态和有限的功能。我认为逻辑回归和偏差/方差权衡是要走的路。

machine-learning - 训练序列长度为 1 的条件随机场是否只是 Maxent 模型？

1 回答 1

Related

Reference