我想要做的是添加一个自定义资源,告诉 SyntaxNet 将两个令牌组合成一个令牌。我正在处理来自 NCBI 的生物医学数据,而物种几乎总是用它们的属(所以,属 + 种)来写。我需要将属 + 种格式保存为单个标记。
例如,
Arthrobacter globiformis (genus = "Arthrobacter", species = "globiformis")
Desulfosporosinus meridiei (genus = "Desulfosporosinus", species = "meridiei")
E. coli (genus = "E.", species = "coli")
在 SyntaxNet 中是否有不包括再培训的方法来做到这一点?