问题标签 [icu]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

715 问题

0 投票

1 回答

219 浏览

c++ - ICU 正则表达式引用

我想知道是否有办法在 ICU (c++) 库中引用字符串。存在 "\Q" + string + "\E" 但我生成的输入是作为提供的字符串输入的。似乎没有任何 ICU 报价正则表达式方法。只需将字符串中的所有 "\E" 更改为 \\E 即可。

c++icu

2010-06-27T03:21:25.330

0 投票

2 回答

1204 浏览

iphone - 从正则表达式匹配组中删除尾随空格

我在 iPhone 上通过 RegKit 使用正则表达式 lib icucore 来替换大字符串中的模式。

我正在寻找的模式看起来像这样

我将此模式与以下正则表达式匹配

当找到匹配项时，这会将输入字符串转换为 3 组，其中第 1 组（字符串）和第 3 组（括号中的字符串）是我感兴趣的。

我正在将这些格式化的字符串转换为 html 链接，以便将上面的内容转换为

我的问题是第三组中的尾随空格。当链接突出显示并加下划线时，会导致该行超出打印的字符。

虽然我知道我可以提取所有匹配项并手动处理它们，但使用 icu lib 的搜索和替换功能是一个更清洁的解决方案，因此我宁愿不这样做。

非常感谢一如既往

2010-06-29T17:46:38.413

0 投票

3 回答

9396 浏览

c++ - UnicodeString 到 char* (UTF-8)

我在 OS X 上使用 C++ 中的 ICU 库。我所有的字符串都是 UnicodeStrings，但我需要使用 fopen、fread 等系统调用。这些函数将 const char* 或 char* 作为参数。我读过 OS X 在内部支持 UTF-8，所以我需要做的就是将我的 UnicodeString 转换为 UTF-8，但我不知道该怎么做。

UnicodeString 有一个 toUTF8() 成员函数，但它返回一个 ByteSink。我还找到了这些示例： http: //source.icu-project.org/repos/icu/icu/trunk/source/samples/ucnv/convsamp.cpp并阅读了有关使用转换器的信息，但我仍然感到困惑. 任何帮助将非常感激。

c++windows utf-8 internationalization icu

2010-06-30T15:09:29.850

0 投票

2 回答

1340 浏览

webkit - 如何让ICU变小？

在 WebKit 中，它使用 ICU，但我没有足够的空间来包含 icudt42.dll。icudt42.dll的大小约为10.4MB，但我只需要中文、俄文和英文，那么如何让icudt.dll变小呢？

webkit icu

2010-07-22T13:04:27.577

0 投票

0 回答

980 浏览

android - android，从 icu4j 迁移到 icu4c

我有与android框架一起使用的类，它调用icu4j的Arabicshaping。现在我已经将这个类与另一个使用 icu4c（c 实现）的 android 分支合并了。但是构建过程给了我错误，说找不到阿拉伯语整形...

在 icu4c 文件中搜索显示它同时具有 ArabicShaping.c 和 ushape.c

但我不知道如何从框架 java 代码中调用它们。

任何想法？谢谢

android icu

2010-09-13T10:07:52.350

0 投票

2 回答

8882 浏览

c++ - Linux 安装库 (ICU) 问题

我是安装库的相对菜鸟。我的系统目前有旧版本的ICU库 (3.8)，我想使用最新版本 (4.4)。

按照 ICU readme.html 中的步骤，一切正常（echo $? 为每个步骤生成全 0）。我看到该库已安装到 /usr/local/lib。但是，当前版本的库安装在 /usr/lib 中。

我的问题。

1）这两个位置之间是否存在“组织”或其他一些显着差异？

2) 如何将新库的安装路径更改为 /usr/lib？

3) 库位于错误的位置是否是我什至在 ICU 目录中运行示例时出现“加载共享库时出错：libicui18n.so.44”的原因？

谢谢大家。

c++linux shared-libraries icu

2010-09-13T17:05:42.307

0 投票

3 回答

3046 浏览

c++ - C++ 将字符串编码为 Unicode - ICU 库

我需要将 ISO-2022-JP 和 ISO-2022-JP-2（以及 ISO-2022 的其他变体）中的一堆字节转换为 Unicode。我正在尝试使用 ICU（链接文本），但以下代码不起作用。

这行不通。结果包含“？” 我输入的任何字符都高于 ASCII。状态没有错误。我究竟做错了什么？

最重要的是，我在编译库 4.4 版时遇到了麻烦，因为 MSVC 9 项目不会转换为 MSVC 10 项目。

我也知道 libiconv 开源库。我无法在 Windows 上编译那个。如果有人对不同的图书馆有任何建议，也欢迎。

谢谢。

编辑我最初使用的转义序列是错误的。所以现在 ICU 接受字符串，去掉转义序列——这是朝着正确方向迈出的一步。但结果仍然包含“？” 字符。

EDIT2我无法转换为 MSVC 10 项目的原因是没有安装 x64 平台（默认情况下不是）。或者，我可以在文本编辑器中打开所有项目并删除所有提及的 x64 目标。

c++c character-encoding icu

2010-09-15T19:37:28.077

0 投票

2 回答

511 浏览

icu - icu4c--> ushape.c 在整形中缺少字符？

在我们的语言中，我们在书写中使用了阿拉伯字符，但存在一些差异，icu 的 ushape.c（阿拉伯语整形器）仅适用于主要的阿拉伯语字符，并不能塑造我的语言特定字符（即 0x6D5 等）我已将 ushape.c 更改为工作用我的语言，它运行良好，除了字符，即 0x649，在阿拉伯语中它们只有 2 种形状，在我的语言中，我们有 4 种形状。

我已经更改了第 183 行

至

并更改了第 121 行

至

来自ushape.c

现在它可以毫无问题地生成 3 个形状（开始、孤立和最终），但中间形状显示为正方形（缺少字符）。

我尝试用其他数字替换“* 0x98”，但这是我能得到的最好的。

我应该怎么办？

icu

2010-10-04T13:59:51.957

0 投票

1 回答

1525 浏览

collation - icu 校对支持哪些语言？

我正在浏览 ICU 源代码 ( http://icu-project.org/ )，但我找不到它支持开箱即用的排序语言。有人可以帮助我吗？

collation icu

2010-10-11T22:45:06.150

0 投票

1 回答

496 浏览

c++ - ICU 探测所有货币符号

有没有办法为库支持的所有UChar表示货币符号探测ICU库？

我当前的解决方案是遍历所有语言环境和每个语言环境，执行以下操作：

然后将 currencySymbol 中的每个 UChar 保存到地图中（因此没有重复项）。

c++unicode map icu

2010-10-12T15:53:08.370

1 2 3 4 5 6 7 8 9 10

问题标签 [icu]

Reference