我正在寻找一个从文本中提取实体的好解决方案。就我而言,实体是电影标题(因此它们可能是很长的字符串),我将它们存储在数据库中。
有什么好方法可以做到这一点?是否有任何已经开发的软件来执行这种任务?
我见过 nltk,但我需要的不是那么复杂:给定一个(巨大的)字符串列表,在输入文本中识别它们。
谢谢!
我正在寻找一个从文本中提取实体的好解决方案。就我而言,实体是电影标题(因此它们可能是很长的字符串),我将它们存储在数据库中。
有什么好方法可以做到这一点?是否有任何已经开发的软件来执行这种任务?
我见过 nltk,但我需要的不是那么复杂:给定一个(巨大的)字符串列表,在输入文本中识别它们。
谢谢!