-2

我想识别任何文本中写的所有名称,目前我正在使用 IMDB 电影评论。

我正在使用 stanford POS 标记器,并分析所有专有名词(因为专有名词是人名、事物、地点的名称),但这很慢。

首先,我标记所有输入行,然后我检查所有带有 NNP 的单词,这是一个缓慢的过程。

是否有任何有效的替代品来完成这项任务?任何库(最好在 JAVA 中)。谢谢。

4

2 回答 2

1

你知道输入语言吗?如果是,您可以将每个单词与字典进行匹配,如果该单词不在字典中,则将其标记为专有名词。它需要一个完整的字典,包含该语言每个单词的所有变格,并注意数字和其他特殊情况。

编辑:另请参阅官方常见问题解答中的此答案:您是否尝试更改使用的模型?

于 2014-04-06T16:50:48.787 回答
0

称为 GlobalNLP 的(付费)网络服务可以使用多种语言进行操作:https ://nlp.linguasys.com/docs/services/54131f001c78d802f0f2b28f/operations/5429f9591c78d80a3cd66926

于 2014-10-29T22:51:44.740 回答