2

我正在尝试实现搬运工词干算法,但我在这一点上绊倒了

其中方括号表示其内容的任意存在。用 (VC){m} 表示 VC 重复 m 次,这又可以写成

[C](VC){m}[V].

当以这种形式表示时,m 将被称为任何单词或单词部分的 \measure\。m = 0 的情况涵盖了空字。这里有些例子:

m=0    TR,  EE,  TREE,  Y,  BY.
m=1    TROUBLE,  OATS,  TREES,  IVY.
m=2    TROUBLES,  PRIVATE,  OATEN,  ORRERY.

我不明白这个“措施”是什么,它代表什么?

4

1 回答 1

2

看起来度量是元音紧跟辅音的次数。例如,

“麻烦”有:

可选的初始辅音[C]=“TR”。

第一个元音辅音组(VC)= “OUBL”。

第二元音辅音组(VC)= "ES"。

可选的结尾元音[V]是空的。

所以度量是两次,次数(VC)是“匹配”的。

于 2010-12-23T16:56:08.260 回答