我正在尝试将地名字符串“智能”转换为 ASCII。我想我正在寻找的是音译。我能够使用“uconv”工具获得一些令人鼓舞的结果:
假设我的输入是“Emberá”:
uconv -x Latin-ASCII input.dat > output.dat
相应的输出将是“Embera”——正是我想要的。但是在某些情况下,我没有得到预期的结果,(也许如果输入不是以拉丁语开头?)。例如,检查这个地方(我无法将名称正确复制并粘贴到此文本框中)http://maps.google.ca/maps?q=karpos+macedonia&hl=en&ie=UTF8&hnear=Karpo%C5%A1 ,+马其顿+(FYROM)&t=m&z=12。
理想情况下,这将被音译为“Karpos”(我认为),但如果我将其用作 uconv 的输入,使用上述命令,uconv 根本不会修改它。
所以给定一个地名列表(如果有人好奇,这里是列表-- http://www.mediafire.com/file/gb0guu117yp1p26/test.dat),我如何将它们转换为ASCII?