假设我有一个标题字符串,用不同的语言编写。
有没有办法检查每个字符串是哪种语言?
我没有玩过它,但你应该看看NSLinguisticTagger及其- (NSOrthography *)orthographyAtIndex:(NSUInteger)charIndex effectiveRange:(NSRangePointer)effectiveRange
方法。来自NSOrthography 文档:
NSOrthography 类描述一段文本的语言内容,通常用于拼写和语法检查。
一个 NSOrthography 实例描述:
文本包含哪些脚本。这些脚本中的每一个的主要语言和可能的其他语言。整个文本的主要脚本和语言。脚本由标准的四字母标签(Latn、Grek、Cyrl 等)统一描述,超级标签 Jpan 和 Kore 通常用于日文和韩文,Hans 和 Hant 用于中文文本;如果无法识别特定脚本,则使用标签 Zyyy。有关国际化的更多信息,请参阅国际化编程主题。
语言由 BCP-47 标签统一描述,最好采用规范形式;如果无法确定特定语言,则使用标签 und。
您可以简单地使用Google Transalate REST API来查找语言。
您可以使用RestKit之类的东西向谷歌服务器发出 REST 请求。
有允许语言对话的谷歌翻译 API。我相信您一定会发现某些东西会为您的字符串返回匹配的语言。有关详细信息,请参阅Google 翻译 API。
您可以使用N-gram 采样频率技术。我不是专家,但据传它们在实践中运行良好。