2

假设我有一个标题字符串,用不同的语言编写。

有没有办法检查每个字符串是哪种语言?

4

4 回答 4

7

我没有玩过它,但你应该看看NSLinguisticTagger及其- (NSOrthography *)orthographyAtIndex:(NSUInteger)charIndex effectiveRange:(NSRangePointer)effectiveRange方法。来自NSOrthography 文档

NSOrthography 类描述一段文本的语言内容,通常用于拼写和语法检查。

一个 NSOrthography 实例描述:

文本包含哪些脚本。这些脚本中的每一个的主要语言和可能的其他语言。整个文本的主要脚本和语言。脚本由标准的四字母标签(Latn、Grek、Cyrl 等)统一描述,超级标签 Jpan 和 Kore 通常用于日文和韩文,Hans 和 Hant 用于中文文本;如果无法识别特定脚本,则使用标签 Zyyy。有关国际化的更多信息,请参阅国际化编程主题。

语言由 BCP-47 标签统一描述,最好采用规范形式;如果无法确定特定语言,则使用标签 und。

于 2012-11-06T08:11:04.927 回答
4

您可以简单地使用Google Transalate REST API来查找语言。

您可以使用RestKit之类的东西向谷歌服务器发出 REST 请求。

于 2012-11-06T07:49:40.877 回答
0

有允许语言对话的谷歌翻译 API。我相信您一定会发现某些东西会为您的字符串返回匹配的语言。有关详细信息,请参阅Google 翻译 API

于 2012-11-06T07:48:37.427 回答
0

您可以使用N-gram 采样频率技术。我不是专家,但据传它们在实践中运行良好。

请参阅netspeak和类似的论文

于 2012-11-06T07:39:12.230 回答