1

left3words除了, left5words, bidirectional,等标准拱形选项之外bi5words,其余选项是什么意思?他们需要什么论据?

我似乎在任何地方都找不到文档!

4

1 回答 1

2

恐怕拱选项目前只记录在源代码中:-(。

请参阅 ExtractorFrames 和 ExtractorFramesRare 类。

首先要做的是查看分布式标记器中使用的拱选项。您可以在模型子目录的 *.props 文件中找到它们。

简单来说:

  • “通用”为您提供了一组不错的基本单词和标签特征(当前、上一个和下一个单词特征、前一个标签和前两个标签,以及前一个标签和当前单词以及当前和前一个单词的连词)。这是一个很好的起点。
  • 有多种选项可以打开一大堆提取器,为英语和中文提供已知的良好配置(双向、sighan2005、naacl2003unknowns)。
  • 其他选项(通常带有参数)以可以混合在一起的合理方式打开功能集。您可以在分布式中文和阿拉伯语标注器的定义中看到这一点。例如,suffix(6) 包括所有长度不超过 6 的以词结尾的子串作为特征。
于 2010-08-03T18:22:55.490 回答