2

我正在尝试将地名字符串“智能”转换为 ASCII。我想我正在寻找的是音译。我能够使用“uconv”工具获得一些令人鼓舞的结果:

假设我的输入是“Emberá”:

uconv -x Latin-ASCII input.dat > output.dat

相应的输出将是“Embera”——正是我想要的。但是在某些情况下,我没有得到预期的结果,(也许如果输入不是以拉丁语开头?)。例如,检查这个地方(我无法将名称正确复制并粘贴到此文本框中)http://maps.google.ca/maps?q=karpos+macedonia&hl=en&ie=UTF8&hnear=Karpo%C5%A1 ,+马其顿+(FYROM)&t=m&z=12

理想情况下,这将被音译为“Karpos”(我认为),但如果我将其用作 uconv 的输入,使用上述命令,uconv 根本不会修改它。

所以给定一个地名列表(如果有人好奇,这里是列表-- http://www.mediafire.com/file/gb0guu117yp1p26/test.dat),我如何将它们转换为ASCII?

4

1 回答 1

3

尝试-x 'Any-Latin;Latin-ASCII' 您还可以将--to-callback escape-unicode -t ascii 输出中的所有内容强制添加到 ascii,否则类似于{U+3045}.

请注意,“智能”在这里是……相对的。您正在剥离大量信息并经过几层翻译。这不会有太大帮助,但是-x 'el-en;Any-Latin;Latin-ASCII'如果您知道文本是从希腊语到英语(即 el-en),那么您可以尝试使用特定语言的音译。

于 2012-09-27T20:51:28.323 回答