我想解析一个文本并根据它们的语法结构对句子进行分类,但是我对 NLP 的了解非常少,所以我什至不知道从哪里开始。
据我所读,我需要解析文本并找出(或标记?)每个单词的词性。然后我搜索动词从句或我想用来对句子进行分类的任何其他定义特征。
我不知道是否已经有一些方法可以更轻松地做到这一点,或者我是否需要单独定义语法规则或什么。
任何讨论这个问题的 NLP 资源都会很棒。程序示例也很受欢迎。我以前使用过 NLTK,但并不广泛。其他解析器或语言也可以!
Python Natural Language Toolkit是一个适合做此类工作的库。与任何 NLP 库一样,您必须单独下载用于训练的数据集,并且还提供用于训练的语料库(数据)和脚本。
还有一些示例教程可以帮助您识别单词的部分语音。无论如何,我认为 nltk.org 应该是您寻找的地方。
具体问题可以再次在这里发布。
可能您需要简单地为每种类型的语法结构定义诸如“名词动词名词”等模式,并在词性标注器输出序列中搜索匹配。