嗨,我想知道我们是否可以在 Doccano 上有类似以下示例的内容:
所以假设我们有这样一句话:“MS 是一家 IT 公司”。我想在这句话中标记一些单词,例如 MS (Microsoft)。MS 应该被标记为 Company(所以想象我有一个名为 Company 的实体),但我还想说 MS 代表 Microsoft。
有没有办法用 Doccano 做到这一点?
谢谢
嗨,我想知道我们是否可以在 Doccano 上有类似以下示例的内容:
所以假设我们有这样一句话:“MS 是一家 IT 公司”。我想在这句话中标记一些单词,例如 MS (Microsoft)。MS 应该被标记为 Company(所以想象我有一个名为 Company 的实体),但我还想说 MS 代表 Microsoft。
有没有办法用 Doccano 做到这一点?
谢谢
多卡诺支持
Sequence Labelling
适用于命名实体识别 (NER)Text Classification
很好,例如情绪分析Sequence To Sequence
适合机器翻译你所描述的听起来有点像实体链接。您可以从Doccano 在其文档中的路线图中看到,实体链接是计划的一部分,但尚不可用。
目前,我建议将其视为 NER 问题,并为 和 设置不同的MS (Microsoft)
实体MS (other)
。如果您有太多实体可供选择,标签可能会变得复杂,但您可以将数据集分解为较小的以实体为中心的数据集。例如,您可以只获取其中包含 MS 的文档,并将提及的内容标记为少数同义词之一。