我目前正在开展一个项目,能够检测何时在正文中提到某个主题/想法将非常有用。例如,如果文本包含:
也许如果你告诉我更多关于琼斯先生是谁,那会有所帮助。如果我能描述一下他的外表,或者更好的是一张照片,那也很有用?
如果能够检测到此人要求提供琼斯先生的照片,那就太好了。我可以采取一种非常天真的方法,只寻找“照片”或“照片”这个词,但如果他们写了这样的东西,这显然是不好的:
请永远不要给我发琼斯先生的照片。
有谁知道从哪里开始?甚至可能吗?
我已经研究过 nltk 之类的东西,但我还没有找到一个人做类似事情的例子,我仍然不完全确定这种分析被称为什么。任何能让我离开地面的帮助都会很棒。
谢谢!