我一直在阅读一些关于 CRF 的论文,对特征函数有点困惑。一元(节点)和二元(边)特征 f 通常具有以下形式
f(yc, xc) = 1{yc=y ̃c}fg(xc)。
其中 {.} 是指示函数,如果包含的条件为真,则为 1,否则为 0。fg 是数据 xc 的函数,它从数据中提取有用的属性(特征)。
现在在我看来,要创建 CRF 特征,必须知道真正的标签 (yc)。这对于训练是正确的,但对于测试阶段,真正的类标签是未知的(因为我们试图确定它们最可能的值)。
我错过了什么吗?如何正确实施?