我正在使用 CRFSuite 进行序列分类(POS 标记)。令我惊讶的是,似乎 CRFSuite 不喜欢标签':' 具有 ':' 作为实际标签的单元或标记被完全跳过(预测输出中没有关于丢失或跳过的项目的备注)
我使用其他与标点符号相关的标签,例如“。” 或“,”,但这些都被正确使用和输出。
有没有人有过类似的经历或现在为什么跳过“:”?
我正在使用 CRFSuite 进行序列分类(POS 标记)。令我惊讶的是,似乎 CRFSuite 不喜欢标签':' 具有 ':' 作为实际标签的单元或标记被完全跳过(预测输出中没有关于丢失或跳过的项目的备注)
我使用其他与标点符号相关的标签,例如“。” 或“,”,但这些都被正确使用和输出。
有没有人有过类似的经历或现在为什么跳过“:”?
来自http://www.chokkan.org/software/crfsuite/tutorial.html:
CRFsuite 接受任何字符串作为属性名称,只要该字符串不包含冒号字符(用于分隔属性名称及其权重)。
所以如果你有一个像 w[0]=the:0.5 这样的属性,属性名称是“w[0]=the”,权重是 0.5。