问题标签 [transliteration]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
225 浏览

php - array_flip() 和 utf8

我有一个数组(18 个键):

这些键是立陶宛符号(utf8 编码)。当我这样做时$lt = array_flip($en);,它会返回以下内容:

如您所见,缺少 4 个键('Ę'、'Ų'、'ę'、'ų')。这里发生了什么?

0 投票
1 回答
361 浏览

c# - 卡在 for c# 循环中!

我有两个 xml 文件,它们具有 devanagri 到 itrans 的映射,这些文件是 dev.xml 和 gujarati.xml。xml文件内容如下:

对于 guj.xml 它是:

而对于 dev.xml 它是

我有一个 global.asax 文件,其中包含以下代码:

此处的代码从两个 xml 文件中读取并将字符存储在一个二维数组中。该数组进一步存储在会话变量中,以便我可以在 default.aspx 中访问它

default.aspx 文件包含以下代码。

这里的 intranscontent 包含带有 div 元素的网页。所以我从中选择文本节点。在这段代码中,我正在访问 global.asax 中的会话变量,节点被转换为字符串,然后转换为 chararray,以便我可以将 devanagri 的字符替换为古吉拉特语。

在 for 循环中,我需要检查每个梵文字符是否有一个等效的古吉拉特语字符,牢记所有音译规则。音译规则就像前一个字符是元音,那么它应该只输出元音。如果有人可以帮助我完成这个 for 循环,我将感谢他们。谢谢!任何疑问请免费发布。

0 投票
3 回答
10860 浏览

java - icu4j 西里尔文转拉丁文

我正在尝试让西里尔字母变成拉丁语,这样我就可以在网址中使用它们。我使用icu4j音译,但它仍然会给出如下奇怪的字符:Vilʹândimaa。它应该更像viljandimaa。当我复制那个网址时,这些字母变成了 %.. 一些无用的东西。

有人知道如何使用 icu4j 将西里尔文转换为 az 吗?

更新

无法回答自己,但发现这个问题非常有帮助:Converting Symbols, Accent Letters to English Alphabet

0 投票
1 回答
1445 浏览

unicode - ICU中的拉丁语<->韩语转换?


我刚刚开始在 C++ 程序中使用 ICU4C 实现 ICU 转换。我特别关注中文的音译。

根据此文档,该软件包同时支持“Han-Latin”和“Latin-Han”转换。作为一名学习中文的学生,这让我感到惊讶,因为如果没有高度先进的统计技术,拉丁汉转换特别困难(我见过的最接近的是谷歌音译,即使没有用户输入,它实际上在这方面做得很好,但这对于目前的项目是不可行的),更不用说没有音标的转换了。我什至怀疑这是否可能,无需诉诸比尔·莫瑞等事实上的外国名字借用字符。这是谷歌地图在其国际领域所采用的方法,正如我们在本文中看到的(PDF)

无论如何,我愿意暂停怀疑,在查阅文档和教程之后,我能够构造两个 Transliterator 对象(to 和 from)并使用它们执行简单的音译。

虽然 Han-Latin 工作得相当好(简单数据的准确率约为 80%),但 Latin-Han 似乎根本不起作用,返回与输入相同的“latin”字符串,这与我使用在线转换得到的结果一致sample,和我对中文的了解一致。我设法找到了这张表,我认为这两个来源都使用了这张表,我们可以在这里看到:

我认为这意味着给定一个拼音字符串,它可能会复制原始字符串,但情况似乎并非如此。

我想我的一般问题是这样的:ICU 或除了谷歌音译之外的任何东西都可以实现这种转换吗?什么是预期的输出?相关地,如果这不是真的可能,是否有 ICU实际支持的脚本对的列表?

感谢您的时间

0 投票
2 回答
934 浏览

php - 用其发音相似的字符替换特殊字符(在 php - utf8 中)

你知道有很多像è或é这样的字符。还有更多,比如ö,ä,ì,á,ù,...

我想用它的“语音伙伴”字符替换这些字符,但我不想为每个单个字符都这样做

有没有常见的方法来做类似的事情:

  • 有没有人写过一个涵盖所有情况的脚本?
  • 有没有办法自动检测这些字符并删除'或'?

到目前为止谢谢

更新:

有没有人推荐这个(在 php.net 上找到)

0 投票
3 回答
4645 浏览

c# - 印地语文本到 C# 的英文音译

我正在寻找可用于将印地语文本转换为英语音译的 ac# 代码。

还告诉我是否有任何可用于 c# 的 api。

0 投票
2 回答
1108 浏览

javascript - 富文本编辑器中的 Google 音译

我需要使用谷歌音译以及富文本编辑支持。

Google Transliteration API 文档推荐Closure 库Yahoo!提供的富文本编辑器。用户界面库

但是,我尝试了它们,但音译不起作用。

有人实现了支持音译的富文本编辑器吗?

[编辑:答案更新如下]

0 投票
0 回答
661 浏览

api - Firefox 中的 Google 音译 API 问题

我正在尝试在 Firefox 4.0.1 和 WindowsXP 中使用 Google Transliterate API helloWorld

我正在使用 node.js 0.4.7 来提供页面

当我通过 node.js 加载页面时,我收到以下错误:“尝试在已清除的范围上运行 compile-and-go 脚本”

如果我双击它并从磁盘在 Firefox 中打开该页面,或者如果我在 IE8、Opera 或 Chrome 中打开它,该页面将成功呈现

知道为什么会发生这种情况以及解决方法是什么吗?这是代码:

0 投票
1 回答
2464 浏览

unicode - ICU定制音译

0 投票
2 回答
2336 浏览

asp.net - 将 unicode 数字从英文转换为梵文

我正在寻找一些 RegEx 或任何其他方法将数字 0-9 转换为 ०-९ (天城文脚本)。我正在使用 asp.net,但在全球化命名空间中找不到执行此操作的任何方法。

任何帮助是极大的赞赏。