0

我想要做的是添加一个自定义资源,告诉 SyntaxNet 将两个令牌组合成一个令牌。我正在处理来自 NCBI 的生物医学数据,而物种几乎总是用它们的属(所以,属 + 种)来写。我需要将属 + 种格式保存为单个标记。

例如,

Arthrobacter globiformis (genus = "Arthrobacter", species = "globiformis")
Desulfosporosinus meridiei (genus = "Desulfosporosinus", species = "meridiei")
E. coli (genus = "E.", species = "coli")

在 SyntaxNet 中是否有不包括再培训的方法来做到这一点?

4

1 回答 1

0

恐怕您的问题没有简单(且有原则)的解决方案。您可以尝试在使用 SyntaxNet 解析数据之前对数据进行预处理。更有原则的解决方案将需要更改代码。

于 2016-08-13T11:08:43.850 回答