问题标签 [icu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - ICU 正则表达式引用
我想知道是否有办法在 ICU (c++) 库中引用字符串。存在 "\Q" + string + "\E" 但我生成的输入是作为提供的字符串输入的。似乎没有任何 ICU 报价正则表达式方法。只需将字符串中的所有 "\E" 更改为 \\E 即可。
iphone - 从正则表达式匹配组中删除尾随空格
我在 iPhone 上通过 RegKit 使用正则表达式 lib icucore 来替换大字符串中的模式。
我正在寻找的模式看起来像这样
我将此模式与以下正则表达式匹配
当找到匹配项时,这会将输入字符串转换为 3 组,其中第 1 组(字符串)和第 3 组(括号中的字符串)是我感兴趣的。
我正在将这些格式化的字符串转换为 html 链接,以便将上面的内容转换为
我的问题是第三组中的尾随空格。当链接突出显示并加下划线时,会导致该行超出打印的字符。
虽然我知道我可以提取所有匹配项并手动处理它们,但使用 icu lib 的搜索和替换功能是一个更清洁的解决方案,因此我宁愿不这样做。
非常感谢一如既往
c++ - UnicodeString 到 char* (UTF-8)
我在 OS X 上使用 C++ 中的 ICU 库。我所有的字符串都是 UnicodeStrings,但我需要使用 fopen、fread 等系统调用。这些函数将 const char* 或 char* 作为参数。我读过 OS X 在内部支持 UTF-8,所以我需要做的就是将我的 UnicodeString 转换为 UTF-8,但我不知道该怎么做。
UnicodeString 有一个 toUTF8() 成员函数,但它返回一个 ByteSink。我还找到了这些示例: http: //source.icu-project.org/repos/icu/icu/trunk/source/samples/ucnv/convsamp.cpp并阅读了有关使用转换器的信息,但我仍然感到困惑. 任何帮助将非常感激。
webkit - 如何让ICU变小?
在 WebKit 中,它使用 ICU,但我没有足够的空间来包含 icudt42.dll。icudt42.dll的大小约为10.4MB,但我只需要中文、俄文和英文,那么如何让icudt.dll变小呢?
android - android,从 icu4j 迁移到 icu4c
我有与android框架一起使用的类,它调用icu4j的Arabicshaping。现在我已经将这个类与另一个使用 icu4c(c 实现)的 android 分支合并了。但是构建过程给了我错误,说找不到阿拉伯语整形...
在 icu4c 文件中搜索显示它同时具有 ArabicShaping.c 和 ushape.c
但我不知道如何从框架 java 代码中调用它们。
任何想法?谢谢
c++ - Linux 安装库 (ICU) 问题
我是安装库的相对菜鸟。我的系统目前有旧版本的ICU库 (3.8),我想使用最新版本 (4.4)。
按照 ICU readme.html 中的步骤,一切正常(echo $? 为每个步骤生成全 0)。我看到该库已安装到 /usr/local/lib。但是,当前版本的库安装在 /usr/lib 中。
我的问题。
1)这两个位置之间是否存在“组织”或其他一些显着差异?
2) 如何将新库的安装路径更改为 /usr/lib?
3) 库位于错误的位置是否是我什至在 ICU 目录中运行示例时出现“加载共享库时出错:libicui18n.so.44”的原因?
谢谢大家。
c++ - C++ 将字符串编码为 Unicode - ICU 库
我需要将 ISO-2022-JP 和 ISO-2022-JP-2(以及 ISO-2022 的其他变体)中的一堆字节转换为 Unicode。我正在尝试使用 ICU(链接文本),但以下代码不起作用。
这行不通。结果包含“?” 我输入的任何字符都高于 ASCII。状态没有错误。我究竟做错了什么?
最重要的是,我在编译库 4.4 版时遇到了麻烦,因为 MSVC 9 项目不会转换为 MSVC 10 项目。
我也知道 libiconv 开源库。我无法在 Windows 上编译那个。如果有人对不同的图书馆有任何建议,也欢迎。
谢谢。
编辑 我最初使用的转义序列是错误的。所以现在 ICU 接受字符串,去掉转义序列——这是朝着正确方向迈出的一步。但结果仍然包含“?” 字符。
EDIT2我无法转换为 MSVC 10 项目的原因是没有安装 x64 平台(默认情况下不是)。或者,我可以在文本编辑器中打开所有项目并删除所有提及的 x64 目标。
icu - icu4c--> ushape.c 在整形中缺少字符?
在我们的语言中,我们在书写中使用了阿拉伯字符,但存在一些差异,icu 的 ushape.c(阿拉伯语整形器)仅适用于主要的阿拉伯语字符,并不能塑造我的语言特定字符(即 0x6D5 等)我已将 ushape.c 更改为工作用我的语言,它运行良好,除了字符,即 0x649,在阿拉伯语中它们只有 2 种形状,在我的语言中,我们有 4 种形状。
我已经更改了第 183 行
至
并更改了第 121 行
至
来自ushape.c
现在它可以毫无问题地生成 3 个形状(开始、孤立和最终),但中间形状显示为正方形(缺少字符)。
我尝试用其他数字替换“* 0x98”,但这是我能得到的最好的。
我应该怎么办 ?
collation - icu 校对支持哪些语言?
我正在浏览 ICU 源代码 ( http://icu-project.org/ ),但我找不到它支持开箱即用的排序语言。有人可以帮助我吗?