13

有谁知道在文本处理的上下文中什么是分块器以及它的用途是什么?

4

3 回答 3

13

根据这些幻灯片,分块是解析的替代方法,它提供句子的部分句法结构,具有有限的树深度,而不是完整的解析。

它比完全解析更受限制,但在提取或忽略信息时就足够了,因此被多次使用,因为它比解析更快、更健壮。

幻灯片中提供了更多信息。

更多链接:

于 2011-01-21T11:00:55.777 回答
7

我个人并不反对其他答案,但Jurafsky 和 ​​Martin给出的定义略有不同。对他们来说,分块特别是一种没有递归短语的浅层解析。

他们给出的一个例子是短语“从丹佛起飞”。一个不会由分块器生成的解析是“[NP the flight [PP from [NP Denver]]]”,因为它暗示了具有 NP 递归性的语法。

于 2013-05-08T10:48:20.310 回答
4

这是一种非常简单的解析类型,称为浅解析。OpenNLP 项目有一个可用的分块器模块,您可以查看其文档以获取分块操作示例

于 2011-01-21T11:02:52.913 回答