我试图找到斯坦福 NLP 使用的希伯来树库中使用的标签集的确切列表。找到这个标签集似乎比找到一个词性标注器更难:)
是否有任何工具可以读取用于训练(Penn?)树库的标签集?
我试图找到斯坦福 NLP 使用的希伯来树库中使用的标签集的确切列表。找到这个标签集似乎比找到一个词性标注器更难:)
是否有任何工具可以读取用于训练(Penn?)树库的标签集?
对于 stanfordnlp python 包,对于所有语言,使用的 POS 标签集是Universal Dependencies (UD) v2 标签集。一些 UD 语料库还包括一个原始的 POS 标签集,通常更细粒度。但是,虽然希伯来树库最初是使用自己的 POS 标签集构建的,然后被转换为 UD,但似乎 UD 存储库中提供的版本仅带有 UD 标签集。个别语言只能使用 UD POS 标签集的子集。您可以在希伯来树树库的树库中心页面上找到详细信息。您会看到使用了 17 个 UD POS 标签中的 15 个。