3

我尝试编写一个应用程序来学习外来字符。例如,如果你想学习日语,那么你必须记住所有的平假名、片假名和汉字字母。(例如あ、い、か... = 平假名カ、サ、ケ... = 片假名本、学... = 汉字)。

示例:某个用户正在尝试学习日语。所以他要学:か=ka
本=hon,意思是:基础/书/本

他还必须学习发音。

我的第一个问题是.net 中是否有任何库或可以轻松完成的东西?我还查看了 Microsoft IME,但我真的不知道如何在我的项目中使用它。

我还查看了 Unicode 数据库,它基本上是可能的。我还设法编写了一个将か转换为 ka 的项目。唯一缺少的是意义(例如本=basis/book/this),它们也由Unicode 数据库提供。不幸的是,我在获取 UCD 数据的 .XML 文件中找不到它们。当我在UCD-Website上输入单词时,它就起作用了。

另一种方法是使用似乎也与 UCD 相关的 CLDR-Library。不幸的是,我无法弄清楚我应该使用哪两个(UCD 或 CLDR)。CLDR:http ://cldr.unicode.org/

我的问题是 UCD 是否是最好的方法,我是否也可以使用 CLDR。

我真的不想使用我自己输入所有字符的普通列表。这将花费太多时间,尤其是对于所有汉字字母(超过 10,000 个)。

谢谢

编辑:我解决了,我从 Unicode 字符数据库 (UCD) 中提取信息。您可以在 .XML 文件中下载整个数据库。我只需要学习如何处理它并找到正确的属性。

4

2 回答 2

2

Google 和 Microsoft 都提供 API,您可以调用它来翻译文本。例如http://www.microsoft.com/en-us/translator/translatorapi.aspx

根据您选择的服务类型,可能需要支付少量费用。他们还为翻译提供声音。无需重新发明这个轮子。:-)

如果这是一个 CodePage 类型的问题。这个博客是一个有趣的起点 http://www.joelonsoftware.com/articles/Unicode.html

编辑:回应关于选项的评论。谷歌可以提供几种可能的翻译

例如对于本</p>

在此处输入图像描述

于 2013-05-04T07:34:30.260 回答
1

您正在寻找的是音译 API 或库。
好吧,实际上,你想要的是一个罗马化库,它并不完全相同,但你最好忘记我说过的,你很快就会发现的,我不想打破你的白日梦。

您可能想查看此https://bitbucket.org/Dimps/unidecodesharpfork
或此http://unidecode.codeplex.com/
或此http://transliterator.codeplex.com/

我使用 unidecodesharpfork 音译俄语,这有点不令人满意,因为它只音译每个字符,根据 ISO 标准无法正确罗马化。

不幸的是,“音译”(你真正需要的是罗马化,所以通过音译我/你的意思是罗马化)并不像在一个字母表中有一个字符列表那么简单,然后用另一个字母表中的相应字符替换每个字符,这似乎是unidecodesharpfork作者的基本信念。

有一些规则,因为有时音译取决于前面或后面的字符,并且还有一个关于罗马化的 ISO 标准,例如俄语(参见http://en.wikipedia.org/wiki/Romanization_of_Russian)。

此外,音译与文化无关。例如,如果您是讲德语的人,您音译俄语的方式与讲英语的人不同。

因此,对于严肃的使用,我会使用谷歌音译 API(仅提供英语使用者的观点),但我只是看到它已被弃用。 https://developers.google.com/transliterate/

也许是时候读出这 10'000 个字符的音译了:)

于 2013-05-04T07:16:45.653 回答