问题标签 [codepages]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
119 浏览

c - 如何在c中显示任意字符?

警告 C4566:由通用字符名称“\u2E81”表示的字符无法在当前代码页中表示 (936)

有时我们需要以各种语言显示文本,如俄语、日语等。

但是似乎单个代码页只能显示一种单一语言的字符,我怎样才能同时显示多种语言的字符?

0 投票
2 回答
639 浏览

c# - 从使用 C# 中的错误代码页中恢复

我已使用代码页 windows-1251 而不是使用 iso-8859-2 从文件中读取字符串“ńîôč˙”。它应该是一些西里尔字符串。如何实现将在 C# 中执行以下操作的函数:

res 是西里尔文字符串,如果我在首先读取文件时使用好页面,我会得到它。

0 投票
2 回答
441 浏览

browser - 浏览器代码页检测

我有一个 ASP.Net 页面,用户可以在其中输入一些文本TEXTAREA并将其提交给服务器。此文本将存储在数据库中,并将显示在 winform 应用程序中。

如何确保winform application显示的字符与用户在 TEXTAREA 中输入的字符完全相同。

也就是说,我是否有潜在的问题,例如,如果用户输入特殊的语言特定字母,例如 Æ、Ø 和 Å,它们是丹麦语字母?
这些字母根据代码页有不同的代码,据我所知,我需要知道 TEXTAREA 控件在哪个代码页中显示其输入。或者我在这里遗漏了什么?

我试图在网上找到这方面的材料,但很难找到解决这个问题的东西。我通常会发现页面谈论服务器需要浏览器使用什么代码页,以便正确显示发送的数据。

但我的问题是另一种方式,即从客户端到服务器。

0 投票
2 回答
1165 浏览

sql - 为什么不显式 COLLATE 覆盖数据库排序规则?

我在 SQL Server 2008 R2 dev 上,服务器默认排序规则是 Cyrillic_General_CI_AS

在 SSMS 中执行
SELECT 'éÉâÂàÀëËçæà' COLLATE Latin1_General_CS_AS

输出

  • eEaAaAeEc?a on(in ocntext of/use dbName) 使用默认排序规则 Cyrillic_General_CI_AS
  • éÉâÂàÀëËçæà 在数据库上使用默认排序规则 Latin1_General_CI_AS

为什么?

0 投票
1 回答
2026 浏览

sql-server-2005 - 带有 Latin1 代码页的 SQL Server 数据库将日文字符显示为“?”

以下场景的三个问题:

  • SQL Server 2005 生产数据库,带有 Latin1 代码页并显示“?” Management Studio 中的无效字符。
  • SomeCompanyApp 客户端作为服务填充来自服务器和工作站的数据。
  • SomeCompanyApp 管理控制台显示“?” 对于亚洲字符。

由于这是一个产品数据库,我不会写信给它。

我不知道将数据存储在数据库中的客户端应用程序是否实际上将其正确存储为 Unicode,并且它根本没有显示,因为它们使用的是 Latin1 作为控制台。

Q1:据我了解,无论代码页如何,SQL Server 都将 nvarchar 文本存储为 Unicode,或者我完全错了,如果代码页是 Latin1,那么不在该代码页中的所有内容都会转换为“?”。

Q2:文字栏也一样吗?

Q3:有没有办法使用 SQL Server Management Studio 或 Visual Studio 和一些代码(不关心哪种语言:))来查询数据库并告诉我字符是否真的显示为日语、中文、韩语等。 ?

我的最终目标是从数据库中提取数据并使用 UTF-8 将其存储在另一个数据库中,以在我自己的客户端 webapp 中显示日语和其他亚洲字符。 我将满足于 Q3 的答案。 我可以用多种语言进行编码,至少可以理解其他一些语言,但我对 Unicode 的了解还不够。如果您想知道我的 webapp 将使用 pyodbc 和 cassandra,但对于这些问题并不重要。

0 投票
1 回答
305 浏览

c# - 构建不同语言和代码页的字符串

我需要构建一个由波斯语字符英语和数字波斯语字符组成的字符串,该字符串应具有阿拉伯文(windows-1256)的代码页,例如 9 个空格字符 + 3 位数字 + 波斯语中的人名,长度为 pf 30,其中它之前的空格变成 30 长度的字符 + 等“---------111----------سارا میری” 当我显示字符串时在消息框中,字符串的顺序不是我想要的

我应该怎么做才能得到上述结果?

0 投票
2 回答
1561 浏览

windows - Perl Unicode 故障

在此输出中,为什么在打印非 ASCII Unicode 字符后会出现额外的换行符?

平台是 Windows Vista 并且问题发生在之后chcp 65001但不是之后chcp 850

从这个程序

0 投票
2 回答
4727 浏览

delphi - 如何使用 Delphi XE 的 TEncoding 将 Cyrillic 或 ShiftJis 文本保存到文件中?

我正在尝试使用 Delphi XE 将与我的系统(例如 Cyrillic)不同的代码页中的一些文本行保存到 TFileStream 中。但是我找不到任何代码示例来生成那些编码文件?

我尝试使用与 TStrings.SaveToStream 相同的代码,但是我不确定我是否正确实现了它(例如 WriteBom 部分),并且想知道它在其他地方将如何完成。这是我的代码:

提前致谢。

0 投票
1 回答
767 浏览

java - 从 java Charset 对象获取数字代码页

如何获取与 Java 中的 Charset 对象关联的数字代码页标识符(即 1252)?我可以调用 displayName() 方法,但它返回字母数字标识符(如“windows-1252”、“cp-1252”、“CP1252”、...),而不仅仅是 int 代码。

在 .NET 中 Encoding 类中存在一个整数 CodePage 属性,但我在 Java 中找不到等效的方法。

谢谢。

0 投票
1 回答
10816 浏览

java - 将字符串从代码页 1252 转换为 1250

如何将String在代码页 1252 中解码的字符转换为String在代码页 1250 中解码的字符。

例如

我想找到这样的convert()功能,打印输出将是:

这些是波兰语特有的字符。

感谢您的任何建议。