1

我将开发具有许多(100 多个)类的命名实体识别系统。假设它们的频率大致相等,那么哪种算法应该表现最好?根据我对 CRF 工作原理的理解(遗憾的是,远非理想),这里应该没问题。但是在某些来源(谷歌书籍)中,我发现了另一种观点。

那么,CRF 是否适合具有大量类的 NER 算法?

4

1 回答 1

0

我们在这里谈论什么样的课程?不要害羞:)

您可能最好使用分层方法:

  1. 有少量的根类,如“product”、“person”、“place”。第一遍找出哪个是哪个。

  2. 然后对于每个根类,都有“汽车产品”、“电子产品”等子类。

于 2014-08-10T21:30:35.803 回答