我正在研究命名实体识别。我评估了基于传统 nlp 技术构建的库,例如 MITIE、Stanford NER、NLTK NER 等。我还研究了用于在向量空间中表示单词的深度学习模型,例如 word2vec 和 Glove 向量,它们很有趣,因为它们提供了有关单词上下文的信息,但特别是对于 NER 的任务,我认为它不太适合。由于所有这些向量模型都创建了词汇和相应的向量表示。如果任何单词未能在词汇表中,则将无法识别。假设命名实体很可能不存在,因为它们不受语言约束。它可以是任何东西。因此,如果在这种情况下必须使用任何深度学习技术,那就是那些通过使用标准英语词汇更依赖于句子结构的技术,即忽略命名字段。有没有这样的模型或方法可用?CNN 或 RNN 会是答案吗?
问问题
1737 次