问题标签 [unicode-string]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
905 浏览

objective-c - Objective-C:如何将 unicode 字符解码回字符串?

NSUTF32BigEndianStringEncoding我使用这样的编码字符串:

例如,这会给我<00000041>字符串的 unicode A。那么我怎样才能A从 unicode 中取回字符串<00000041>。非常感谢你。

0 投票
3 回答
9846 浏览

c++ - 将 Unicode 字符串写入文件

我正在尝试编写一个读写文件的类。对于字符串,有两种方法:ANSI 和 Unicode。ANSI 函数没问题,但我的 Unicode 函数有问题。

有点连线,我可以直接读取 Unicode 文件,而无需检查或跳过“0xFEFF”内容。无论我使用哪种语言(我尝试过英语、中文和日语),它都可以正常工作。有什么我应该知道的吗?

然后最大的问题就跳出来了:将Unicode字符串写入文件。首先我尝试了简单的英语作为没有'\n'字符的字母,它确实很好用。然后我将 '\n' 推入并开始出现问题:输出插入了许多空格,如“abcdefg \nhijklmn \nopqrst \nuvwxyz”('\n' 有效,但有很多空格)并且文件再次为 ANSI。不要问其他语言的字符,我什至根本看不懂。

所以这里有一个问题:我应该怎么做才能正确地将Unicode字符串写入文件以及如何?请不要提及“_wopen”功能,文件已经用“fopen”功能打开。

答案和建议将不胜感激。

我正在使用 Windows 7 和 Visual Studio。

编辑:它适用于具有以下代码的非英文字符,但 '\n' 仍然错误。

但这是如何工作的?我的意思是我在阅读文件时没有看到它。

编辑:我的代码的一部分。

输出文件内容为:“abcdefg਍栀碗樀欀氀洀渀ഀopqrst਍甀淤眀砀礀稀”,文件为Unicode。

我不知道它是否是“L'\n'”的正确表达,我以前从未使用过Unicode。谢谢你帮助我:)

0 投票
1 回答
1031 浏览

ruby-on-rails - rails 2.3 和 ruby​​ 1.9 中的无效字节序列 utf-8 错误

我已经将我的应用程序从 Rails 2.3.8 / Ruby 1.8.7 迁移到 2.3.14 / Ruby 1.9.2 - 这并不容易,但基本上可以工作。我一直遇到的一个问题是,在偶尔的 Haml 模板中,我会收到以下错误:

这是一个编码问题,我已经看到了一些关于如何处理它的建议(使用Iconv.conv),但我尝试过的东西似乎不起作用。如何在应用程序级别解决此问题(不必修补每个模板)?谢谢。

编辑:一些堆栈跟踪

数据库表的CHARSET编码为UTF-8. 我没有为我的模板分配任何特定的编码,尽管我设置了

environment.rb

0 投票
4 回答
4804 浏览

perl - Perl:将 Unicode 字符串打印到 Windows 控制台

我在将 Unicode 字符串打印到 Windows 控制台时遇到了一个奇怪的问题*。

考虑这段文字:

假设它在一个名为“file.txt”的文件中。

当我去*:“type file.txt”时,它打印得很好。但是当它从 Perl 程序中打印出来时,像这样:

Unicode 行(在这种情况下为希伯来语)每次都会再次出现,部分中断,如下所示:

(我将所有内容都保存在 UTF-8 中)。

这很奇怪。有什么建议么?

(这不是“Console2”问题*——同样的问题出现在“常规”Windows 控制台上,只是在那里您看不到希伯来语字形)。


* 使用“Console”(也称为“Console2”) - 这是一个不错的小实用程序,可以在 Windows 控制台上使用 Unicode - 例如,请参见: http ://www.hanselman.com/blog/Console2ABetterWindowsCommandPrompt.aspx

** 注意:在控制台,你当然要说:

0 投票
2 回答
2345 浏览

visual-c++ - MASM中的宽字符串文字?

你用

声明name为 byte-string "Foo"

您如何将其声明为字符串?(即每个字符 16 位)

编辑:

我正在寻找一种在宏中运行良好的方法,例如:

0 投票
1 回答
1962 浏览

python - 将 unicode 字符串(日文字符)作为命令行参数传递

我只想问是否有人知道使用 python 2.7,我将如何将 unicode 字符串(例如日语文件名)作为我的 python 脚本的命令行参数传递。一旦这个文件名被正确地传递给函数/方法,一些文件处理(例如元数据提取/检索)将由一些引擎(一个DLL,被识别为支持unicode)完成。我尝试了以下方法,但不幸的是,python 崩溃了:

将文件名传递给将处理文件的方法:

在方法上,这就是我解码传递的字符串的方式:

任何反馈都会有很大帮助。非常感谢!

0 投票
5 回答
23003 浏览

python - python 2.7中的base64编码unicode字符串

我有一个使用requests模块从 web 服务检索到的 unicode 字符串,其中包含二进制文档的字节(PCL,碰巧)。其中一个字节的值为 248,尝试对其进行 base64 编码会导致以下错误:

我觉得这有点令人惊讶,因为 248 在无符号字节的范围内(并且可以保存在字节字符串中),但我真正的问题是:编码这个字符串的最佳或正确方法是什么?

我目前的解决方法是:

这似乎可以正常工作,并且结果byte_string能够进行 base64 编码,但似乎应该有更好的方法。有没有?

0 投票
1 回答
4843 浏览

c - 检查字符串是否包含另一个 C

现在我有这个代码,但它总是设置为空

你能解释一下为什么我的 strstr 总是为空吗?

0 投票
1 回答
312 浏览

javascript - 如何获取字符范围

我即将导入 SVG - 带有 Javascript 的字体,以便能够为单个字母设置动画。因此,我将字形存储在 Javascript 对象中,其中字形的 Unicode 值定义键,字形本身成为值。因此,当我从给定字符串创建文本时,我使用字符串中的每个字符来获取合适的字形。我的问题来了:

glyphs unicode 属性(在此处指定)的 unicode 值可以是十六进制 ( unicode="&#x66;&#x66;&#x6c;") 或十进制 ( unicode="&#102;&#102;&#108;") 表示法的 XML 字符引用。对于 hkern- 和 vkern-elements(表示字距调整表),以 Unicode 范围给出的字符(指定herehere)。是否有任何图书馆可以从所有这些可能的变化中进行转换?有没有人知道我可以找到可以帮助我解决这个问题的更多信息的资源?

总体问题是将 Input 的所有可能变体转换为一致的 unicode 值列表,我可以将其用作字形映射的键。

0 投票
2 回答
934 浏览

c++builder - LeftStr() 用于 UnicodeString 类型

我正在将一些 C++Builder 代码移动到 BCB2010,并且需要用适当的函数替换调用LeftStr()RightStr()因为这些函数没有UnicodeString重载。

AnsiLeftStr()似乎工作,但名字吓到我了......