问题标签 [icu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sorting - 日语排序
我正在开发一个需要用日语进行排序的应用程序。
日文排序需要将片假名和汉字转成平假名,然后按照UTF-8编码进行排序。
平假名、片假名和汉字字符应组合在一起,并按平假名等效“拼写”排序。注意:使用平假名“字母”——a、i、u、e、o、ka、ki、ku、ke、ki 等。
你能告诉我如何执行这项任务吗?
像任何逻辑步骤或链接等。
如果有任何开源代码可以从哪里获得帮助?
sorting - 如何将日文字符分类为汉字或片假名或平假名?
我正在开发一些需要对日本语言进行分类的应用程序。
日文排序需要将片假名和汉字转成平假名,然后按照UTF-8编码进行排序。
平假名、片假名和汉字字符应组合在一起,并按平假名等效“拼写”排序。注意:使用平假名“字母”——a、i、u、e、o、ka、ki、ku、ke、ki 等。
现在要完成这项任务,我需要:
1.将日文字符分类为汉字或片假名或平假名。
2.将片假名和汉字转换为平假名。
3.应用基于语音(平假名)进行排序的算法。
应用程序数据库采用 UTF-8 格式。
现在执行第一步:“将日文字符分类为汉字或片假名或平假名。” ,
我想知道在 Sqlite3 、 QT 、 ICU 或任何其他可以提供字符 Unicode 的包中是否存在用于 C 或 C++ 编程语言的 API?
在Unicode的基础上,我们可以很容易地对日文字符进行分类。
如果我错了,请纠正我?
c - icu unicode中是否有等效的strdup?
这个问题是不言自明的。我正在使用 C API。
mysql - ICU Collator 基于区域设置和自定义规则
如果可以同时使用基于两者的 ICU 整理服务的整理器:
像“ko_KR”这样的语言环境(coll = ucol_open("ko_KR", &status))
自定义规则,即“剪裁”( coll = ucol_openRules(rlz, rlen, UCOL_OFF,UCOL_TERTIARY,NULL,&status) )
Collator_Final = Collator_Locale + Collator_customize_rule
如果是,那么请建议我们如何同时使用基于两者的整理器?
delphi - 有人用过Delphi的ICU吗?
有没有人使用过 Delphi 的 ICU(见http://site.icu-project.org/)DLL?
具体来说,我对代码页转换和整理功能感兴趣。
查看头文件,它们似乎主要是在使用类的 C++ 中,所以在没有做太多研究的情况下,我认为有必要围绕它创建一个简单的包装器,以导出可以在 Delphi 中轻松导入的简单函数。
有没有人为此做过任何工作?
或者任何人都可以为 Delphi 推荐一个不同的解决方案,它对代码页和排序规则具有类似的广泛覆盖范围?
visual-studio - 哪个 ICU 版本最适合 Visual Studio Express 2008?
ICU 4.6 有可供下载的 Microsoft Visual Studio 2010 版本,但没有用于 Visual Studio 2008 的版本。我使用的是 2008 Express,因为它似乎比 2010 版本更免费,而且可以免费下载 MSDN 2008 年,但 2010 年并非如此(如果我错了,请纠正我)。
ICU 的先前版本是 4.4,但仅提供“Visual Studio 9”的下载。现在,我在 Microsoft 网站或 Wikipedia 上都找不到有关此 Visual Studio 9 的信息。可能是 9 是 Visual Studio 2008 中 C/C++ 编译器的版本,还是更旧的版本?
icu - ICU 相当于 strerror(3) 用于获取 UErrorCode 的消息?
我尝试过 RTM,但是:给定一个 ICU UErrorCode
,我怎样才能获得相应的错误消息字符串?即,ICU 相当于strerror(3)
.
mysql - 如何结合ICU Collation自定义规则
我想在我的应用程序中使用两个 ICU 自定义排序规则,例如:
- "&b < 一个"
- "&z < w"
那么,如何组合这些规则,以便我可以在 ucol_openRules() API 中使用它?
c++ - 在 ICU UnicodeString 中 countChar32() 和 length() 有什么区别?
来自文档;
长度是 UnicodeString 中 UChar 代码单元的数量。如果您想要代码点的数量,请使用 countChar32()。
和
计算字符串长度 UChar 代码单元中的 Unicode 代码点。
一个代码点可以占用一个或两个 UChar 代码单元。计算代码点涉及读取所有代码单元。
由此我倾向于认为代码点是一个实际的字符,而代码单元只是字符的一个可能部分。
例如。
假设您有一个 unicode 字符串,例如:
'foobar'
长度和 countChar32 均为 6。然后假设您有一个由 6 个字符组成的字符串,该字符串采用完整的 32 位来编码长度为 12,但 countChar32 为 6。
它是否正确?
sqlite - 如何在 SQLite 中实现重音/变音符号不敏感搜索?
这个问题与此处提出的问题有关,但我无法找到答案。
我已经在 SQLite 中启用了 ICU 支持并重建了 Db 引擎,现在该怎么办?我通过执行 SELECT UPPER("ä") 检查了 ICU 支持,结果为 Ä。