问题标签 [icu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
219 浏览

c++ - ICU 正则表达式引用

我想知道是否有办法在 ICU (c++) 库中引用字符串。存在 "\Q" + string + "\E" 但我生成的输入是作为提供的字符串输入的。似乎没有任何 ICU 报价正则表达式方法。只需将字符串中的所有 "\E" 更改为 \\E 即可。

0 投票
2 回答
1204 浏览

iphone - 从正则表达式匹配组中删除尾随空格

我在 iPhone 上通过 RegKit 使用正则表达式 lib icucore 来替换大字符串中的模式。

我正在寻找的模式看起来像这样

我将此模式与以下正则表达式匹配

当找到匹配项时,这会将输入字符串转换为 3 组,其中第 1 组(字符串)和第 3 组(括号中的字符串)是我感兴趣的。

我正在将这些格式化的字符串转换为 html 链接,以便将上面的内容转换为

我的问题是第三组中的尾随空格。当链接突出显示并加下划线时,会导致该行超出打印的字符。

虽然我知道我可以提取所有匹配项并手动处理它们,但使用 icu lib 的搜索和替换功能是一个更清洁的解决方案,因此我宁愿不这样做。

非常感谢一如既往

0 投票
3 回答
9396 浏览

c++ - UnicodeString 到 char* (UTF-8)

我在 OS X 上使用 C++ 中的 ICU 库。我所有的字符串都是 UnicodeStrings,但我需要使用 fopen、fread 等系统调用。这些函数将 const char* 或 char* 作为参数。我读过 OS X 在内部支持 UTF-8,所以我需要做的就是将我的 UnicodeString 转换为 UTF-8,但我不知道该怎么做。

UnicodeString 有一个 toUTF8() 成员函数,但它返回一个 ByteSink。我还找到了这些示例: http: //source.icu-project.org/repos/icu/icu/trunk/source/samples/ucnv/convsamp.cpp并阅读了有关使用转换器的信息,但我仍然感到困惑. 任何帮助将非常感激。

0 投票
2 回答
1340 浏览

webkit - 如何让ICU变小?

在 WebKit 中,它使用 ICU,但我没有足够的空间来包含 icudt42.dll。icudt42.dll的大小约为10.4MB,但我只需要中文、俄文和英文,那么如何让icudt.dll变小呢?

0 投票
0 回答
980 浏览

android - android,从 icu4j 迁移到 icu4c

我有与android框架一起使用的类,它调用icu4j的Arabicshaping。现在我已经将这个类与另一个使用 icu4c(c 实现)的 android 分支合并了。但是构建过程给了我错误,说找不到阿拉伯语整形...

在 icu4c 文件中搜索显示它同时具有 ArabicShaping.c 和 ushape.c

但我不知道如何从框架 java 代码中调用它们。

任何想法?谢谢

0 投票
2 回答
8882 浏览

c++ - Linux 安装库 (ICU) 问题

我是安装库的相对菜鸟。我的系统目前有旧版本的ICU库 (3.8),我想使用最新版本 (4.4)。

按照 ICU readme.html 中的步骤,一切正常(echo $? 为每个步骤生成全 0)。我看到该库已安装到 /usr/local/lib。但是,当前版本的库安装在 /usr/lib 中。

我的问题。

1)这两个位置之间是否存在“组织”或其他一些显着差异?

2) 如何将新库的安装路径更改为 /usr/lib?

3) 库位于错误的位置是否是我什至在 ICU 目录中运行示例时出现“加载共享库时出错:libicui18n.so.44”的原因?

谢谢大家。

0 投票
3 回答
3046 浏览

c++ - C++ 将字符串编码为 Unicode - ICU 库

我需要将 ISO-2022-JP 和 ISO-2022-JP-2(以及 ISO-2022 的其他变体)中的一堆字节转换为 Unicode。我正在尝试使用 ICU(链接文本),但以下代码不起作用。

这行不通。结果包含“?” 我输入的任何字符都高于 ASCII。状态没有错误。我究竟做错了什么?

最重要的是,我在编译库 4.4 版时遇到了麻烦,因为 MSVC 9 项目不会转换为 MSVC 10 项目。

我也知道 libiconv 开源库。我无法在 Windows 上编译那个。如果有人对不同的图书馆有任何建议,也欢迎。

谢谢。

编辑 我最初使用的转义序列是错误的。所以现在 ICU 接受字符串,去掉转义序列——这是朝着正确方向迈出的一步。但结果仍然包含“?” 字符。

EDIT2我无法转换为 MSVC 10 项目的原因是没有安装 x64 平台(默认情况下不是)。或者,我可以在文本编辑器中打开所有项目并删除所有提及的 x64 目标。

0 投票
2 回答
511 浏览

icu - icu4c--> ushape.c 在整形中缺少字符?

在我们的语言中,我们在书写中使用了阿拉伯字符,但存在一些差异,icu 的 ushape.c(阿拉伯语整形器)仅适用于主要的阿拉伯语字符,并不能塑造我的语言特定字符(即 0x6D5 等)我已将 ushape.c 更改为工作用我的语言,它运行良好,除了字符,即 0x649,在阿拉伯语中它们只有 2 种形状,在我的语言中,我们有 4 种形状。

我已经更改了第 183 行

并更改了第 121 行

来自ushape.c

现在它可以毫无问题地生成 3 个形状(开始、孤立和最终),但中间形状显示为正方形(缺少字符)。

我尝试用其他数字替换“* 0x98”,但这是我能得到的最好的。

我应该怎么办 ?

0 投票
1 回答
1525 浏览

collation - icu 校对支持哪些语言?

我正在浏览 ICU 源代码 ( http://icu-project.org/ ),但我找不到它支持开箱即用的排序语言。有人可以帮助我吗?

0 投票
1 回答
496 浏览

c++ - ICU 探测所有货币符号

有没有办法为库支持的所有UChar表示货币符号探测ICU库?

我当前的解决方案是遍历所有语言环境和每个语言环境,执行以下操作:

然后将 currencySymbol 中的每个 UChar 保存到地图中(因此没有重复项)。