0

是否可以从句子中删除标签?可以通过扫描文件并找到标签并删除它们来完成它,但是由于标签很多(有些型号有 30+,有些型号有 48-50 左右,它们基本上遵循penn treebank pos 标签),有没有快速和以更有效的方式删除标签的甜蜜方式?我确实检查了 API,但没有这样的方法来删除标签。

4

1 回答 1

1

没有什么特别的内置,但由于输出包括单词和它的标签,我不确定你为什么需要再次扫描原始文档。您不能通过从最后一个 tagSeparator 字符('/' 或其他字符)删除直到空白来删除标签吗?或者,它可以更简单地使用

-outputFormat tsv

然后你会得到两列输出,第一列是单词,第二列是标签,完成后你可以保留第一列。

于 2012-03-17T00:30:06.120 回答