假设我们的名字是用任何非拉丁字母写的——语言等Arabic, Hebrew, Chinese, Japanese
。
同名的和怎么可能search engine
匹配。反之亦然?original name
English spelling
类似于拓海
日语中的名称和English
拼写Takumi
。
这样做有什么algorithm/technique
用?
假设我们的名字是用任何非拉丁字母写的——语言等Arabic, Hebrew, Chinese, Japanese
。
同名的和怎么可能search engine
匹配。反之亦然?original name
English spelling
类似于拓海
日语中的名称和English
拼写Takumi
。
这样做有什么algorithm/technique
用?
再会。
您必须执行以下操作:
用相同的符号对世界上的每个语言进行分类:
all langs:
最后,您将在任何语言中的任何符号拼写之间都有规则。一些语言,例如印地语、中文等没有任何规则。您应该创建自己的规则(基于此语言的转录)。
algo:
[w][e][п] = wep
呃
e - eng r - rus 转录[п] = p
搜索引擎(如谷歌)可能有大量的数据集(语料库),每个语料库都有不同的语言。
当你想把一个语言的词翻译成另一种语言时,可以通过在第一种语言的语料库中搜索该词,并在第二种语言的语料库中返回兼容的词来完成。(名称的相同技术)
这是基本的想法。
您最好在此处阅读有关 NLP 领域的一些背景知识: http ://en.wikipedia.org/wiki/Natural_language_processing