1

在我正在开发的应用程序中,我需要知道一串单词是否是名词短语、动词短语等。我知道 NP 和 VP 既不是依赖关系也不是 POS。我也明白,要做到这一点,我可能需要某种分块工具,但我找不到任何开源工具。

在 SyntaxNet 的“她真的很喜欢可爱的黑狗”这句话的输出中:

likes VBZ ROOT
 +-- She PRP nsubj
 +-- really RB advmod
 +-- dog NN dobj
     +-- cute JJ amod
     +-- black JJ amor

我注意到NP“可爱的黑狗”已经放在了它自己的树节点中:

 +-- dog NN dobj
     +-- cute JJ amod
     +-- black JJ amor

所以我想知道是否有任何方法可以使用 SyntaxNet 作为分块器?

4

1 回答 1

1

老实说,那里有准确的快速分块器(如NLTK),我不明白为什么要使用依赖解析树来提取块。

虽然您可以查看可能对您的应用程序有用的这个 google 示例代码(它不提供块,但提供主语、宾语和动词),并为您提供一些关于如何定义正则表达式以提取大多数名词短语的线索。

于 2016-08-05T00:28:04.660 回答