1

是否有任何带有标记实体的现有数据集来训练 MITIE ner 模型?我检查了链接,https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py,它只用两个样本训练模型。是否有任何带有标记实体的现有数据集进行训练?

4

1 回答 1

2

我也一直在寻找这样的东西。仅用于“通用”(因此不是很有用)NLU 后端。到目前为止,我唯一发现的是一个训练有素的模型,其中包含 9 个新闻类别(不是很通用)。请参阅此处的博客文章:http: //eric-yuan.me/ner_1/

如果您可以选择切换 NER,则 spaCy 默认提供经过训练的模型。它的可视化前端可以通过谷歌“displacy”找到

如果您发现其他任何东西,请告诉我!

编辑:花了一天的时间研究这个,我想我已经找到了你想要的东西。如果您访问https://github.com/mit-nlp/MITIE/releases,您会发现 MITIE 自己的 NER 模型在 Wikipedia、Freebase 等上进行了训练。实际的训练数据集也在那里。他们 github 页面上的 README 提供了有关如何使用预训练模型的示例。您还可以研究示例文件夹中的 ner.py 文件,以了解如何在 python 代码中使用预训练模型。

于 2017-10-10T22:54:24.977 回答