3

假设我们的名字是用任何非拉丁字母写的——语言等Arabic, Hebrew, Chinese, Japanese

同名的和怎么可能search engine匹配。反之亦然?original nameEnglish spelling

类似于拓海日语中的名称和English拼写Takumi

这样做有什么algorithm/technique用?

4

2 回答 2

2

再会。

您必须执行以下操作:

用相同的符号对世界上的每个语言进行分类:

all langs:

  • 英语 [26 个字母] a bcd e fg ...
  • 俄语 [33 个字母] a б в г д е ....
  • 中文 [x 字母] ....
  • 乌克兰语 [x 字母] a б в г д ..... i
  • 日语 [x 字母] ...
  • .....................

最后,您将在任何语言中的任何符号拼写之间都有规则。一些语言,例如印地语、中文等没有任何规则。您应该创建自己的规则(基于此语言的转录)。

algo:

[w][e][п] = wep

e - eng r - rus 转录[п] = p

于 2012-07-05T13:23:40.217 回答
0

搜索引擎(如谷歌)可能有大量的数据集(语料库),每个语料库都有不同的语言。

当你想把一个语言的词翻译成另一种语言时,可以通过在第一种语言的语料库中搜索该词,并在第二种语言的语料库中返回兼容的词来完成。(名称的相同技术)

这是基本的想法。

您最好在此处阅读有关 NLP 领域的一些背景知识: http ://en.wikipedia.org/wiki/Natural_language_processing

于 2012-07-05T13:14:11.123 回答