问题标签 [transliteration]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 从西里尔文音译为拉丁文 ICU4j java
我需要做一些相当简单但没有哈希映射硬编码的事情。
我有一个 String s,它是西里尔文我需要一些关于如何使用自定义过滤器将其转换为拉丁字符的示例(如果 String s = sniff,请给出一个纯拉丁示例,以免混淆任何人;我希望它查找嗅探并将它们更改为其他内容(也可能有组合)。
我可以看到 ICU4j 可以做这种事情,但我不知道如何实现它,因为我找不到任何工作示例(或者我只是愚蠢)。
任何帮助表示赞赏。
谢谢
此致,
PS我需要批量翻译。我不关心样式或动态音译,只是关于 ICU4j 批量音译器的一些基本示例。
KI实际上得到了它。
也是基于规则的音译的最后一次编辑(如果您不想使用预先存在的一次或只是想要定制的东西)
ruby-on-rails - Rails I18n 音译规则配置
所以,我想为我拥有的许多语言环境预加载音译规则。我在我的一个初始化程序文件(app/config/initializers/locales.rb)中包含了以下代码:
但是,如果我尝试音译:I18n.transliterate("Some Russian text")
,我会收到一堆“?” 符号,意思是音译者没有规则,所以他不知道如何进行音译。
但!
如果我在语言环境文件(en.yml)中定义了它们(规则),如下所示:
然后它起作用了-尽管我有一个问题,关于它是如何工作的。如果我指定I18n.transliterate("абвгд")
- 效果很好,但如果我这样做"абвгд".parameterize
了,出于某种原因,字母“a”被省略(就像一开始没有“a”字母一样)。
为什么 ?
有人可以帮忙吗?
iphone - 音译问题
La> ila>ha illAlla>hu wah}dahu> la> shari>ka lahu, lahul mulku wa lahul h}amdu, wa huwa 'ala> kulli shai'in nadir.
这是yah的音译。使用的字体是 Times New Arabic 。应用此字体后,我没有看到任何更改。“>”之类的字符没有消失。任何解决方案?
c++ - C++ 从数组复制到数组
我已经尝试了很多关于这个问题的建议解决方案,但都没有成功。
我有一个长度为 1000 的 const char 数组,称为english_line,其中包含由空格分隔的单词。这个数组被传递给一个函数。根据我们的任务简介,必须使用此功能来实施解决方案。
我想将该数组的内容一次一个单词复制到另一个二维数组temp_eng_word
`
当我运行它时,我收到错误:
我花了一天中最好的时间来解决这个问题。显然我是一个相对新手。
任何提示或建议将不胜感激:)
c++ - 翻译/音译问题
我正在开发一个翻译/音译程序,该程序读取一个英语故事,然后使用英语/精灵语词典将其翻译成精灵语。在下面显示的代码之后,我解释了我收到的错误。
我有很多代码,我不确定是否应该全部发布,但我会发布我认为应该足够的内容。如果我的代码看起来很奇怪,请道歉 - 但我只是一个初学者。
有一个主文件,一个带有两个类的头文件: Translator和Dictionary,以及一个用于实现类功能的cpp文件。
我有一个构造函数,可以将字典文件读入dictFileName并将英文单词复制到englishWord中,将精灵词复制到elvishWord 中:
在主文件中,英文行被读入toElvish函数,并标记为单词数组temp_eng_words。
在这个 toElvish 函数中,我正在调用另一个函数;translate,它读取temp_eng_words并应该返回精灵词:
这是翻译功能:
我的问题是,当我运行程序时,我收到错误' *out_s was not declared in this scope* '。
如果您已阅读所有这些内容,谢谢;任何建议/线索将不胜感激。:)
java - 在 Android 中使用 GoogleAPI 进行音译
需要帮忙..!我正在研究 Android 音译,我的代码中出现了 3 个错误。
我已经正确导入了所有必需的包,并且还添加了必需的外部 jar 文件。但无法知道我到底哪里出错了。以下是我的代码片段-->
Image-1 包导入的 Image-2 代码包含错误 Image-3 我的构建配置
请帮忙..谢谢....!!
php - 在哪里可以找到 PHP 音译器 (Intl) 的 ID 或规则列表?
Transliterator::listIDs()
将列出 ID,但显然它不是一个完整的列表。
在此页面的示例中,ID 如下所示:
这有点奇怪,因为 ID 应该是唯一的。这看起来更像是一个规则,但如果我将它传递给方法它就不起作用createFromRules
:)
无论如何,我正在尝试从字符串中删除任何标点符号,但破折号 ( -
) 或特定列表中的字符除外。
你知道这是否可能吗?或者是否有一些文档可以更好地解释音译器的语法?
search - 音译和模糊搜索,例如 Google 建议
我需要对字符的音译进行模糊搜索,例如:
我有一个 ASP.NET 应用程序数据库,它有一个包含西班牙语单词列表(200,000 个条目)的表,我还有一个带有输入字段的页面。关键是我不懂西班牙语,也不知道如何用西班牙语拼写搜索词,但我知道它的发音。因此,我在文本框中输入了搜索词,例如“beautiful”,但在录制错误时 - “prekieso”,我需要从数据库中获取正确的版本:“precioso”。
如何实施?换句话说,我需要类似于谷歌建议的东西......
ruby - Ruby 字符音译
在 Ruby 中将字符音译为 7 位 ASCII 的当前最佳方法是什么?我在 SO 上看到的大多数问题都是 3 或 4 年前的问题,并且解决方案不能完全起作用。
我想要一种适用于各种拉丁字母的方法,例如,转换
你的简历是一本非百科全书
至
你的简历不是百科全书
但我找不到这样做的方法,特别是对于将 8 位 ASCII 折叠为 7 位 ASCII 的方法。
由于Iconv
已弃用,如果不需要,我宁愿不使用它,但如果这是唯一有效的方法,我会这样做。显然,我可以将自定义的 8 位 ASCII 转换为 7 位 ASCII,但我更喜欢使用经过全面测试的受支持解决方案。
Unicode 的 International Components使用其 Latin-ASCII 翻译可以很好地处理翻译,但这仅适用于 Java 和 C。
更新
我最终做的是编写自己的字符翻译例程来处理标点符号和空格,之后我可以用它I18n.transliterate
来完成其余的工作。我仍然更喜欢找到并使用维护良好的库函数来处理I18n
没有的东西。
java - 有没有像 Perl 5 的 Text::Unidecode 这样的 Java 库?
Perl 5 在 CPAN 上有一个名为Text::Unidecode
将 Unicode 音译为 ASCII 的模块。因此,例如,如果您将 string"“北亰 — it’s the best”"
交给它,它会将 string 交回"\"Bei Jing -- it's the best\""
。快速搜索 Java 库来做同样的事情只会发现会去除 Unicode 字符或将重音字符转换为非重音字符的代码。
有谁知道产生类似输出的 Java 库Text::Unidecode
?