5

我目前正在开展一个项目,我认为能够提出各种语言的单词的语音表示会非常有帮助。我知道 Aspell 做得很好,但我不认为有一个非常简单的方法来获取他们的语音表示,所以我问:有没有其他好的包来获取给定单词和语言的单词的语音表示/方言/口音/不管它来自哪里?

这不需要使用任何特定的语言,但如果是 Perl,那将是最好的。

我已经尝试过 Soundex、Metaphone、DoubleMetaphone 和Text::Phonetic中的所有其他东西,但这些东西都不是很好——绝对远不及 Aspell 中的东西。

4

3 回答 3

1

首先想到的是Soundex。当然,还有一个 Perl 模块Soundex。虽然这旨在从输入生成 soundex“键”,但它可能有助于将不同的变体映射到公共键。

于 2012-01-25T21:04:27.110 回答
1

CPAN 中有一个包 Text::Aspell。可能有用。

于 2012-02-13T15:59:41.670 回答
0

我你正在尝试制作一个谷歌风格的建议/纠正系统,它不仅仅是基于语音或人工智能,而是基于大量的用户输入。当用户进行搜索,并且没有点击任何链接而是更正输入并再次搜索时,它为谷歌提供了大量关于“正确”写作的数据,而不是语音测试或字典匹配。主要问题在于人类语言本身,并不是人们以一种确定性的方式说话或写作,更不用说使用多种语言了。当然,我可能是错的,但如果你需要一个库,让你这样做:

getLanguage(string);

我想看到它的工作,真的。

于 2012-02-13T17:31:24.050 回答