0

我正在尝试使用 Soundex 和/或 Metaphone 等语音算法来生成听起来与给定字典单词相似的单词。我是否必须拥有所有字典单词的语料库才能做到这一点?是否有另一种方法可以在不使用语料库的情况下生成听起来与给定单词相似的单词?我正在尝试用 Python 来实现。

4

1 回答 1

2

如果您不使用语料库,那么您可能必须手动定义一组规则以将单词拆分为语音部分,然后找到相近音素的列表。这可以生成类似的发音词,但大多数不会存在。如果您想生成存在的发音接近的单词,那么您必然需要一个语料库。

您没有明确您的任务目标,但您可能对Will Leben “Sounder I”(以及 II 和 III)和Jabberwocky 句子的作品感兴趣。

于 2015-06-22T16:06:21.397 回答