0

嗨,我想知道我们是否可以在 Doccano 上有类似以下示例的内容:

所以假设我们有这样一句话:“MS 是一家 IT 公司”。我想在这句话中标记一些单词,例如 MS (Microsoft)。MS 应该被标记为 Company(所以想象我有一个名为 Company 的实体),但我还想说 MS 代表 Microsoft。

有没有办法用 Doccano 做到这一点?

谢谢

4

1 回答 1

0

多卡诺支持

  • Sequence Labelling适用于命名实体识别 (NER)
  • Text Classification很好,例如情绪分析
  • Sequence To Sequence适合机器翻译

你所描述的听起来有点像实体链接。您可以从Doccano 在其文档中的路线图中看到,实体链接是计划的一部分,但尚不可用。

目前,我建议将其视为 NER 问题,并为 和 设置不同的MS (Microsoft)实体MS (other)。如果您有太多实体可供选择,标签可能会变得复杂,但您可以将数据集分解为较小的以实体为中心的数据集。例如,您可以只获取其中包含 MS 的文档,并将提及的内容标记为少数同义词之一。

于 2020-12-27T11:30:32.640 回答