问题标签 [ucs2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
45 浏览

mysql - 我正在处理什么样的文件以及如何将其加载到 MySQL 表中?

我正在从 FTP 服务器下载这个文件,当我在 VIM 中打开它时,它看起来像这样:

在此处输入图像描述

在此处输入图像描述

当我在 Notepad++ 中打开它时,我看到了这个(看起来很正常):

在此处输入图像描述

所以我试着看看这个文件的编码是什么,发现它在

在此处输入图像描述

现在的问题是,从 FTP 下载文件后,我需要将此文件加载到临时表中。如何安全地将其加载到 utf8 格式的表中?

当我导入到我的 MySQL 表时,它看起来像下面的表,字符之间有一个空格:

在此处输入图像描述

0 投票
1 回答
2234 浏览

utf-8 - 在 C++98 中将 UTF-8 与 UCS-2 相互转换

如何在环境中将 UTF-8 字符串转换为 UCS-2 字符串,反之亦然:

  • C++98

  • 允许Boost,但不允许其他库(例如,不允许 Microsoft 或 3d 派对)

到目前为止我学到了:

  • 我需要 UCS-2,而不是 UTF-16。所以utf_to_utf()单独是行不通的。

  • 在 C++98中std::codecvt_utf8不可用。

  • 也不可用: std::locale locale(" en_GB.utf8 ") (但有希望的方法?)

我不敢相信这在 C++98 中这么难?

0 投票
1 回答
251 浏览

python - 嵌入式 Cython UCS2 UCS4 问题

我有一些 python 代码我试图使用 cython api 构造嵌入到 c++ 代码中。出于测试目的,我一直在研究: Cython 作为 Python 到 C 转换器的示例程序

使用稍微修改的代码:

运行后

我尝试编译接收错误消息:

我已经看到有关此事的其他问题,例如An UCS2-UCS4 incompatibility import failure of a Cythnized pure-Python module,当我运行时:

我得到符合 UCS4 的 1114111。所以我想知道的是如何解决这个未定义的引用,当我的 python 版本似乎与那里的正确 UCS 一致时,而不是其他地方。

0 投票
0 回答
173 浏览

python - Python ucs-4/ucs-2 不兼容

我在尝试将我的 Python 解释器(使用 UCS-4 编译)与本地 MPICH2 库(使用 UCS-2 编译)链接时遇到了不兼容问题。错误信息如下所示:

ImportError:/home/densitymatrix4/a/gu163/.local/lib/python2.7/site-packages/mpi4py/MPI.so:未定义符号:PyUnicodeUCS2_DecodeUTF8

我想知道除了重新安装 UCS-2 python 解释器(因为我没有服务器的管理权限)之外,是否有任何方法可以解决这个问题。比如找一个基于UCS-4的MPI库?

或者有人对这个问题有什么建议吗?非常感谢!

0 投票
1 回答
1470 浏览

python - 通过 pyenv 将 Python 构建为 UCS-4

我遇到了这个问题ImportError numpy/core/multiarray.so: undefined symbol: PyUnicodeUCS2_AsASCIIString在pyenv-virtualenv环境中安装 Python 。

在我的情况下,它发生在matplotlib包而不是numpy(如上面的问题中),但它基本上是相同的问题。

该问题中给出的答案很简单:

针对构建为 UCS-4 的 Python 重建 NumPy。

我不知道该怎么做。在另一个问题中,据说必须使用:

但我不知道如何将该命令与pyenv一起使用。

这个问题也在pyenv's repo issue list中提到,并在评论中给出了解决方案。可悲的是(对我来说)我不明白如何应用上述评论中解释的修复程序。

所以我的问题基本上是:如何通过 将 Python 构建为 UCS-4 pyenv

0 投票
2 回答
775 浏览

unicode - ټ,ګ,ځ,څ,ڼ,ښ,ډ,ۍ,ړ,ې 在普什图语中的语境形式的 Unicode

我正在开发一个程序,它给出正确的文本格式,例如如果我写سلام所以它给FEB3, FEE0, FE8E and FEE2女巫是سـ, ـلـ,ﺎ,ـم的 Unicode ,然后如果我写ټول字符 ټ 的 Unicode067C但是有不是字符ټـ的 Unicode,它是初始上下文形式

所以我在维基百科中找到了 ټ,ګ,ځ,څ,ڼ,ښ,ډ,ۍ,ړ,ې 的Unicode找不到上下文形式的Unicode

例如ټـ ,ـټـ,ـټUnicode

如果有人知道这个问题的解决方案,我正在等待回复。谢谢...

0 投票
1 回答
366 浏览

php - PHP fwrite 和 unicode 代码问题

这是我的简单代码:

在文本区域中输入文本:

图片

文本文件中保存的文本: 在此处输入图像描述

我的要求是在文本文件中保存相同的文本

0 投票
0 回答
1692 浏览

c++ - ucs2 和 utf8 之间的转换

我正在尝试在 和 之间进行utf8转换ucs2

不幸microsoft vs2015的是,使用codecvt. 导致以下错误:

错误 LNK2001 无法解析的外部符号“__declspec(dllimport) public: static class std::locale::id std::codecvt::id”

有谁知道如何以一种可行的方式解决这个错误linux

0 投票
1 回答
1336 浏览

python-2.7 - Python unicode - UCS2 与 UCS4

我遇到了一个场景,我必须在 UCS-2 和 UCS-4 之间进行选择。UCS-2 vs UCS-4与Python相关的意义是什么?它们有何不同?

0 投票
1 回答
203 浏览

java - (Java)如何读取可以使用各种编码的文本文件并将内容输出到看起来正常的文本文件中?

我正在读取一个文件并替换一些文本,然后逐行编写一个新文件。我使用以下代码来读取和写入文件。通常 CP1252 和 UTF-8 编码的文件没有问题,但是当我尝试读取以“UCS-2 LE BOM”编码的文件时,保存的文件以 BOM 字符开头并包含大量空白. 我知道这是由于编码造成的,但我不知道是否需要以不同的方式读取它或以不同的方式保存它。另外,我知道我可以在读入文件时设置编码,但是如何处理不同编码的文件而不知道是哪一个。在文件遇到我的 java 代码之前,我无法控制它。任何帮助表示赞赏,谢谢。