问题标签 [transliteration]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
10 回答
40453 浏览

c# - 如何将西里尔文音译为拉丁文

我有一种方法可以将任何拉丁文本(例如英语、法语、德语、波兰语)变成它的 slug 形式,

例如Alpha Bravo Charlie=>alpha-bravo-charlie

但它不适用于西里尔文字(例如俄语),所以我想要做的是将西里尔文字音译为拉丁字符,然后将其 slugify。

有没有人有办法进行这种音译?无论是通过实际来源还是图书馆。

我正在用 C# 编码,所以 .NET 库可以工作。或者,如果您有非 C# 代码,我相信我可以转换它。

0 投票
3 回答
9110 浏览

c# - C# 中的 Slugify 和字符转写

我正在尝试将以下 slugify 方法从 PHP 转换为 C#: http ://snipplr.com/view/22741/slugify-a-string-in-php/

编辑:为方便起见,这里是上面的代码:

除了找不到与以下 PHP 代码行等效的 C# 代码之外,其余部分的代码我没有遇到任何问题:

编辑: 这样做的目的是将非ASCII字符翻译Reformáció Genfi Emlékműve Előttreformacio-genfi-emlekmuve-elott

0 投票
5 回答
1905 浏览

python - Python - 检查一个字符是否在字典中,如果不处理它

我正在从一种源语言(输入文件)音译到目标语言(目标文件),所以我在源代码的字典中检查等效映射,源代码中的某些字符没有等效映射,例如comma(,) 和所有其他此类特殊符号。如何检查字符是否属于我具有等效映射的字典,甚至处理要在目标文件中打印的在字典中没有等效映射的特殊符号。谢谢:)。

0 投票
3 回答
2351 浏览

python - Python - 编解码器将 ascii 编码为 un​​icode:错误

:) 我正在尝试将输入文件(当前为英文)的音译反转回其原始形式(印地语)的过程

输入文件的示例或一部分如下所示:

它在英语中的等效含义是:

我的脚本如下所示:

我得到的错误是:

你能告诉我如何处理这个错误。谢谢..:)

0 投票
3 回答
2096 浏览

internationalization - 搜索音译表

如果您的母语不是 EN_US,或者您知道任何其他口语就好了,您可以轻松贡献!)

阿拉伯字母及其音译

阿拉伯字母及其音译 (gif)
(来源:narod.ru

保加利亚语字母表及其音译

保加利亚语字母表及其音译 (gif)

通缉! **

0 投票
1 回答
1086 浏览

ajax - Google AJAX 音译 API:是否可以使页面中的所有输入字段都可音译?

我使用了“Google AJAX Transliteration API”,它对我来说很顺利。

http://code.google.com/apis/ajaxlanguage/documentation/referenceTransliteration.html

目前我有一个项目,我需要每个页面中的所有输入字段(输入和文本区域标签)都是可音译的,而这些输入字段因页面而异(动态)。据我所知,我必须在 API 调用中调用 makeTransliteratable(elementIds, opt_options) 方法来定义哪些输入字段可以进行音译,在我的情况下,我无法手动预定义这些字段。有没有办法做到这一点?

提前致谢

0 投票
3 回答
1404 浏览

java - 波斯音译 Java API

我需要音译并EnglishPersian在离线模式下使用它。有没有可以离线使用的免费 API?

0 投票
1 回答
2248 浏览

java - 从拉丁字符中删除重音符号(变音符号)以进行比较

我需要将使用拉丁字母书写的欧洲地名与某些字符上的重音符号(变音符号)进行比较。有很多中欧和东欧的名字在 and 上带有重音符号,如拉丁字符žü但有些人只使用没有重音符号的常规拉丁字符写名字,如zand u

我需要一种方法让我的系统识别例如与使用的所有其他重音字符mšk žilina相同msk zilina和相似。有没有一种简单的方法可以做到这一点?

0 投票
3 回答
822 浏览

perl - Perl 的 tr/// 没有做我想做的事

编辑: tr/// 不支持变量插值,所以我s/\Q$_\E//g;改用

或者,更有可能的是,我做的不对……

我有以下代码:

我只想将字符串传递给strip_invalid()并通过...tr///删除字符...我哪里出错了?(顺便说一句,使用正则表达式它可以工作)。@invalidmap

0 投票
1 回答
3849 浏览

php - 在 mod_php/apache2 中 iconv utf-8 到 ascii 音译

我需要比较字符串和匹配名称,即使它们的拼写方式不同。例如DÉSIRÉ-Smith应该匹配Desireesmith以及 Desiree 或Desi'ree Smith

所以我有以下方法,它使用 PHP-CLI 在命令行中完美运行:

然而,在我作为模块Server version: Apache/2.2.14 (Ubuntu)运行的网站中PHP Version 5.3.2-1ubuntu4.2,我总是得到问题标志。有趣的是,错误必须发生在这一行

因为之后我可以看到每个没有被音译的字符,但是那些应该被 ascii 字符替换的字符变成了问号。

我尝试了输入/输出字符串编码和 iconv 内部、输入和输出编码设置以及语言环境设置的所有可能组合。我什至做了 chmod -R 777 /usr/lib/gconv 并将其移至我的工作目录。

但是我看到这个错误报告在他的邮件列表上: http ://bugs.php.net/bug.php?id=44096

我试过我的 www-data 用户在 /var/www/ 的家中,最后我得到了文件夹 /var/www/usr/lib/gconv/ 以及 /var/www/myproject/usr/lib/gconv /

仅供参考:我有编码检测和转码功能,以确保传递正确的编码,但为了清楚起见将它们删除,因为如果你输入 utf8 字符串就不需要它们,一切都应该没问题......

有任何想法吗?