我想识别任何文本中写的所有名称,目前我正在使用 IMDB 电影评论。
我正在使用 stanford POS 标记器,并分析所有专有名词(因为专有名词是人名、事物、地点的名称),但这很慢。
首先,我标记所有输入行,然后我检查所有带有 NNP 的单词,这是一个缓慢的过程。
是否有任何有效的替代品来完成这项任务?任何库(最好在 JAVA 中)。谢谢。
我想识别任何文本中写的所有名称,目前我正在使用 IMDB 电影评论。
我正在使用 stanford POS 标记器,并分析所有专有名词(因为专有名词是人名、事物、地点的名称),但这很慢。
首先,我标记所有输入行,然后我检查所有带有 NNP 的单词,这是一个缓慢的过程。
是否有任何有效的替代品来完成这项任务?任何库(最好在 JAVA 中)。谢谢。
你知道输入语言吗?如果是,您可以将每个单词与字典进行匹配,如果该单词不在字典中,则将其标记为专有名词。它需要一个完整的字典,包含该语言每个单词的所有变格,并注意数字和其他特殊情况。
编辑:另请参阅官方常见问题解答中的此答案:您是否尝试更改使用的模型?
称为 GlobalNLP 的(付费)网络服务可以使用多种语言进行操作:https ://nlp.linguasys.com/docs/services/54131f001c78d802f0f2b28f/operations/5429f9591c78d80a3cd66926