2

我在哪里可以找到这样的语料库?我需要它在标记(单词)级别构建印地语和英语之间的语言检测器。

例如,像罗马字母中的印地语维基百科这样的东西会非常有用。还是短篇小说、社交媒体帖子或推文或博客?有任何想法吗?

据我所知,现有的音译引擎并不是那么好。如果有好的,也会考虑使用。

4

1 回答 1

1

通过在https://translate.google.co.in/上选择“文本”选项进行搜索时,Google 翻译会提供音译结果。 样本。

但是,有一个问题。它的字符数限制为 5k。令人惊讶的是,谷歌在翻译其他任何地方时不提供此功能。(google docs、gmail 等)如果您能够找到更可行和更强大的解决方案来解决您的问题,请告诉我。

于 2020-04-15T11:59:51.997 回答