1

我正在使用 CRFSuite 进行序列分类(POS 标记)。令我惊讶的是,似乎 CRFSuite 不喜欢标签':' 具有 ':' 作为实际标签的单元或标记被完全跳过(预测输出中没有关于丢失或跳过的项目的备注)

我使用其他与标点符号相关的标签,例如“。” 或“,”,但这些都被正确使用和输出。

有没有人有过类似的经历或现在为什么跳过“:”?

4

1 回答 1

2

来自http://www.chokkan.org/software/crfsuite/tutorial.html

CRFsuite 接受任何字符串作为属性名称,只要该字符串不包含冒号字符(用于分隔属性名称及其权重)。

所以如果你有一个像 w[0]=the:0.5 这样的属性,属性名称是“w[0]=the”,权重是 0.5。

于 2015-01-30T21:34:34.783 回答