我们有一段文本要检查语法正确性。我们正在使用 NLTK,在 POS 标记之前一切都很好,但是当我们开始解析时,我们意识到 nltk 仍然没有像Stanford Parser那样的统计解析。NLTK 允许我们制作不灵活的玩具语法。
所以在一个类似的问题中,用户 larsmans 提到使用斯坦福解析器,然后根据概率检查块。但斯坦福不推荐。
你能推荐我们工具、算法、指针、建议,这些工具可以帮助我们在正确的道路上建立,检查语法(比如平均 20 个单词长度的句子,最好是 python)。我们找到了这个。