问题标签 [unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
5688 浏览

ms-access - 使用波浪号分隔符将 MSAccess 表导出为 Unicode

我想从 MSAccess2003 中导出几个表的内容。这些表包含 unicode 日文字符。我想将它们存储为波浪号分隔的文本文件。

我可以使用文件/导出手动执行此操作,并在“高级”对话框中选择波浪号作为字段分隔符和 Unicode 作为代码页。

我可以将其存储为导出规范,但这似乎是特定于表的。

我想使用 VBA 代码导出许多表。

到目前为止,我已经尝试过:

子导出表()

结束子

当我运行它时,我得到一个异常:

运行时错误“3011”:Microsoft Jet 数据库引擎找不到对象“Allowance1#txt”。确保该对象存在并且正确拼写其名称和路径名。

如果我此时调试,TableName 是“Allowance1”,正如预期的那样。

我想我的 UnicodeTilde 导出规范是特定于表的,所以我不能将它用于多个表。

解决办法是什么?我应该使用 TransferText 以外的其他东西,还是以编程方式创建导出规范?

任何帮助表示赞赏。

0 投票
3 回答
3147 浏览

c++ - 为嵌入式应用程序从 std::string 切换到 std::wstring?

到目前为止,我一直在我的嵌入式系统(路由器、交换机、电信设备等)的 C++ 应用程序中使用 std::string。

对于下一个项目,我正在考虑从 std::string 切换到 std::wstring 以获得 Unicode 支持。例如,这将允许最终用户在命令行界面 (CLI) 中使用中文字符。

我应该期待什么并发症/头痛/惊喜?例如,如果我使用仍然使用 std::string 的第三方库怎么办?

由于对国际字符串的支持对我所从事的嵌入式系统类型的要求并不那么强烈,因此我只会在不会引起严重头痛的情况下这样做。

0 投票
4 回答
14204 浏览

c - Windows 中的 UTF-8

如何在 C Windows 程序中将代码页设置为 UTF-8?

我有一个使用 fopen 打开文件的第三方库。我可以使用 wcstombs 将我的 Unicode 文件名转换为当前代码页,但是如果用户的文件名包含代码页之外的字符,那么这会中断。

理想情况下,我只需调用 _setmbcp(65001) 将代码页设置为 UTF-8,但是 _setmbcp 的 MSDN 文档指出不支持 UTF-8。

我怎样才能解决这个问题?

0 投票
4 回答
2921 浏览

sql-server - 使用 Microsoft SQLServer 和 Unicode 避免代码更改

如何让 MSSQL 服务器默认接受 Unicode 数据到 VARCHAR 或 NVARCHAR 列?

我知道你可以通过在要放置在字段中的字符串前面放置一个 N 来做到这一点,但老实说,这在 2008 年似乎有点过时,尤其是使用 SQL Server 2005。

0 投票
4 回答
14161 浏览

php - 如何使用 Zend 框架生成 pdf 文件_with_ utf-8 多字节字符

Zend Framework Zend_Pdf 类有一个“小”问题。从生成的 pdf 文件中去除多字节字符。例如,当我写 aąbcčdeę 时,它变成 abcd 并去掉了立陶宛字母。

我不确定它是特别是 Zend_Pdf 问题还是一般的 php。

源文本以 utf-8 编码,以及完成这项工作的 php 源文件。

预先感谢您的帮助 ;)

PS 我运行 Zend Framework v. 1.6 并使用 FONT_TIMES_BOLD 字体。FONT_TIMES_ROMAN 确实有效

0 投票
8 回答
46792 浏览

python - 如何使用 Python 将文件格式从 Unicode 转换为 ASCII?

我使用 3rd 方工具以 Unicode 格式输出文件。但是,我更喜欢它是 ASCII。该工具没有更改文件格式的设置。

使用 Python 转换整个文件格式的最佳方法是什么?

0 投票
13 回答
30631 浏览

php - 如何在字符串中转换 Word 智能引号和破折号?

我有一个带有文本区域的表格。用户输入存储在数据库中的文本块。

有时,用户会从 Word 中粘贴包含智能引号或短划线的文本。这些字符在数据库中显示为: –, ’, “ ,â€</p>

我应该在输入字符串上调用什么函数来将智能引号转换为常规引号并将 emdashes 转换为常规破折号

我在 PHP 中工作。

更新:感谢迄今为止所有出色的回应。Joel 网站上关于编码的页面信息量很大: http: //www.joelonsoftware.com/articles/Unicode.html

关于我的环境的一些注意事项:

MySQL 数据库使用 UTF-8 编码。同样,显示内容的 HTML 页面通过显式设置元内容类型使用 UTF-8(更新:)。

在这些页面上,智能引号和破折号显示为带有问号的菱形。

解决方案:

再次感谢您的回复。解决方案是双重的:

  1. 确保数据库和 HTML 文件已明确设置为使用 UTF-8 编码。
  2. 使用htmlspecialchars()而不是 htmlentities().
0 投票
5 回答
5913 浏览

c++ - 使用 ICU 库的 UTF-8 到 ASCII

我有一个带有 UTF-8 字符的 std::string 。
我想用 ASCII 字符将字符串转换为最接近的等价物。

例如:

Łódź => Lodz
Assunção => Assuncao
Schloß => Schloss

不幸的是 ICU 库真的很不直观,我还没有找到关于它的使用的好的文档,所以我要花太多时间来学习使用它。我没有的时间。

有人可以举一个关于如何做到这一点的小例子吗?
谢谢。

0 投票
6 回答
25762 浏览

java - Java 运行时不支持编码“UTF-8”

每当我在 SUN Java(构建 1.6.0_10-rc2-b32 和其他 1.6.x 构建)下启动基于 Apache Felix (OSGi) 的应用程序时,我会在控制台上看到以下消息输出(通常在 Ubuntu 8.4 下):

警告:Java 运行时不支持编码“UTF-8”。

在同时运行 Tomcat 和 Resin 时,我偶尔也会看到此消息。如果 java 支持 unicode 和 UTF-8,是什么导致了这个消息?我还没有找到任何参考,或者在其他任何地方回答这个问题。

0 投票
6 回答
10012 浏览

c++ - SQLite (C/C++) 的不区分大小写的 UTF-8 字符串排序规则

我正在寻找一种方法来以不区分大小写的方式比较和排序 C++ 中的 UTF-8 字符串,以便在 SQLite 的自定义排序规则函数中使用它。

  1. 理想情况下,该方法应该与语言环境无关。但是我不会屏住呼吸,据我所知,排序规则非常依赖于语言,所以任何适用于英语以外的语言的东西都可以,即使这意味着切换语言环境。
  2. 选项包括使用标准 C 或 C++ 库或小型(适用于嵌入式系统)和非 GPL(适用于专有系统)第三方库。

到目前为止我所拥有的:

  1. strcoll使用 C 语言环境和std::collate/std::collate_byname时区分大小写。(这些有不区分大小写的版本吗?)
  2. 我尝试使用 POSIX strcasecmp,但似乎没有为其他语言环境定义"POSIX"

    在 POSIX 语言环境中,strcasecmp() 和 strncasecmp() 进行从高到低的转换,然后进行字节比较。结果在其他语言环境中未指定。

    而且,事实上,strcasecmp在 Linux 上使用 GLIBC 的语言环境之间的结果并没有改变。

    这是打印的:

    /li>

附言

是的,我知道ICU ,但由于其巨大的尺寸,我们不能在嵌入式平台上使用它。