问题标签 [icu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 如何在没有过滤器列表的情况下使用 Locale::acceptFromHttp?
locale_accept_from_http
是 ICU API 的基本包装器,uloc_acceptLanguageFromHTTP
但 PHP/PECL 实现似乎存在根本缺陷,它使用系统的整个语言环境集而不是将列表作为参数?
例如说用户有HTTP_ACCEPT_LANGUAGE = zh-HK;q=0.2, fr
,即用户阅读繁体中文或法文,更喜欢后者。例如,您有一个提供繁体中文和简体中文文章的新闻网站。使用 API
Locale::acceptFromHttp
只会返回fr
.
输出:
java - icu4j 西里尔文转拉丁文
我正在尝试让西里尔字母变成拉丁语,这样我就可以在网址中使用它们。我使用icu4j音译,但它仍然会给出如下奇怪的字符:Vilʹândimaa。它应该更像viljandimaa。当我复制那个网址时,这些字母变成了 %.. 一些无用的东西。
有人知道如何使用 icu4j 将西里尔文转换为 az 吗?
更新
无法回答自己,但发现这个问题非常有帮助:Converting Symbols, Accent Letters to English Alphabet
unicode - ICU中的拉丁语<->韩语转换?
我刚刚开始在 C++ 程序中使用 ICU4C 实现 ICU 转换。我特别关注中文的音译。
根据此文档,该软件包同时支持“Han-Latin”和“Latin-Han”转换。作为一名学习中文的学生,这让我感到惊讶,因为如果没有高度先进的统计技术,拉丁汉转换特别困难(我见过的最接近的是谷歌音译,即使没有用户输入,它实际上在这方面做得很好,但这对于目前的项目是不可行的),更不用说没有音标的转换了。我什至怀疑这是否可能,无需诉诸比尔·莫瑞等事实上的外国名字借用字符。这是谷歌地图在其国际领域所采用的方法,正如我们在本文中看到的(PDF)
无论如何,我愿意暂停怀疑,在查阅文档和教程之后,我能够构造两个 Transliterator 对象(to 和 from)并使用它们执行简单的音译。
虽然 Han-Latin 工作得相当好(简单数据的准确率约为 80%),但 Latin-Han 似乎根本不起作用,返回与输入相同的“latin”字符串,这与我使用在线转换得到的结果一致sample,和我对中文的了解一致。我设法找到了这张表,我认为这两个来源都使用了这张表,我们可以在这里看到:
我认为这意味着给定一个拼音字符串,它可能会复制原始字符串,但情况似乎并非如此。
我想我的一般问题是这样的:ICU 或除了谷歌音译之外的任何东西都可以实现这种转换吗?什么是预期的输出?相关地,如果这不是真的可能,是否有 ICU实际支持的脚本对的列表?
感谢您的时间
c++ - 在 VS2008 下构建 ICU 样本的问题
我尝试使用 Visual Studio 2008 构建 ICU4C 样本“ uncv ”但没有成功
- 我添加了头目录(配置属性 > C/C++ > 常规 > 附加包含目录)
- 引用了 lib 文件夹(配置属性 > 链接器 > 附加库目录)
- 我在 PATH 环境变量中添加了 bin 文件夹
在构建“函数中引用的未解析的外部符号...”类型的错误后,将显示。我错过了什么吗?
c++ - 如何使用 boost::asio:write 调用发送 ICU UnicodeString?
我目前正在使用 ICU 库来处理 Unicode 数据,并试图UnicodeString
通过套接字发送一个。目前正在查看使用基本时间服务器的示例:
现在,我查看了各种函数签名,看起来好像boost::asio::buffer
可以boost::asio::const_buffer
采用UnicodeString
. 我应该如何转换为const_buffer
,或者我应该以其他方式进行此操作?提前感谢您的所有回复。
c++ - 我可以在 ICU 中从 char* 转换为 UChar 吗?
我有一个 char *(包含 utf-8 字符串),我想将其传递给 ICU 以将其转换为 ANSI (ISO-8859-6)。不幸的是,大多数 ICU 函数似乎都采用 UChar 而不是 char*。
我怎样才能进行这种转换?
icu - icu和内存转换器
我想从内存中创建一个转换器。
我已经创建了 etrypoint_dat,然后从我的转换器创建了 c 文件,并将这两个结构连接在一起:
从我调用的代码
现在我的问题是:如何在调用 setAppData 后创建转换器?
以下不起作用:
c++ - 寻找有关如何使用 ICU 的简单实用 C++ 示例
我正在寻找有关如何使用 ICU 的简单实用 C++ 示例。
ICU 主页在这方面没有帮助。
我对什么和为什么 Unicode 不感兴趣。
少数演示不是自包含且不可编译的示例(包含在哪里?)
我正在寻找类似“Hello, World”的内容:
如何打开和读取以 UTF-8 编码的
文件操作 UTF-8 编码字符串等的函数。
c++ - ICU和字符串比较
谁能解释为什么以下比较不相等?