CMUdict 适用于英语,但如果我想计算另一种语言内容的音节怎么办?
问问题
1862 次
3 回答
4
这取决于语言。这听起来像是一个显而易见的答案,但这一切都归结为正字法的设计方式。在英语中,音节几乎与单词的书写方式无关,因此您需要一本字典。许多其他语言都是这样的。
不过,某些其他语言(如(南)韩语、日语平假名和片假名(但不是汉字))的书写方式使得字符本身显然与一个音节或特定数量的音节相匹配。在这种情况下,如果你知道这些语言是如何工作的,理论上你可以使用 Python 将文字分解成音节。
否则,您需要一本字典或其他一些可以处理此问题的编译平台。四处逛逛nltk
,看看你能找到什么。
于 2012-11-26T20:23:18.387 回答
2
一般来说,没有。某些语言可能有,但如果您没有字典,则需要了解这些语言的语言结构。单词如何划分为音节因语言而异。
于 2012-11-26T20:19:04.837 回答
0
您当然不能以通用方式对所有语言进行此操作,因为不同的语言将声音呈现为不同的文本。
例如,匈牙利语单词“vagy”对于说英语的人来说看起来像是两个音节,但实际上只有一个音节。英语单词“bike”自然会被许多其他语言的使用者读成两个音节。
此外,对于英语,如果没有字典,您可能无法非常准确地做到这一点,因为英语的拼写有很多奇怪的变化。例如,我们将“poet”中的“oe”发音为两个不同的音节,但“does”中只有一个音节。这可能也适用于其他一些语言。
于 2012-11-26T20:52:41.283 回答