问题标签 [codepages]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
2042 浏览

python - 如何使用 python 执行具有特定语言环境/代码页的 windows 命令(ipconfig、netstat)

我想使用 python解析到 Windows 命令的输出,例如ipconfig,netstat等。tasklist

但是这些命令的输出的某些部分(固定)是根据当前的语言环境/代码页返回的。

例如在ipconfig输出中

或其他语言,具体取决于代码页。

是否有任何方法可以执行命令,例如os.popen("ipconfig")使用特定的语言环境/代码页设置。

  1. 我尝试使用语言环境模块: locale.setlocale(locale.LC_ALL,"american_united states") locale.getlocale()返回"English_United States.1252"os.system("chcp")仍返回旧代码页:936os.popen("ifconfig")返回中文字符串。

  2. os.system("chcp 65001") 现在os.popen("ifconfig")返回英文字符串,但它会清除控制台的所有先前输出(可能是打开新控制台),这是不可接受的。

有没有任何方法可以执行命令,例如os.popen("ipconfig")特定的语言环境/代码页设置?任何帮助表示赞赏。

0 投票
3 回答
2192 浏览

c# - 如何确定代码页 850 中 C# 中字符的索引?

我有一个使用代码页 850 编码的文本文件。我正在通过以下方式读取此文件:

现在,我需要line在代码页 850 中该字符的从零开始的索引上方的循环中字符串中的每个字符,例如:

这可能吗?怎么可能int GetIndexInCodepage850(char c)

0 投票
1 回答
1076 浏览

c++ - 解码电子邮件的有趣 ISO 编码

我有一个电子邮件正文(char[] 缓冲区,通过 POP3 检索),它显然使用了 ISO 代码页的一些标记,例如一个主题

被编码为

有什么预制的东西我可以用来把它变成一个(可读的)CStringW吗?

(环境:Win32、C++、VC2008。)

0 投票
3 回答
1316 浏览

c - 如何在 Win32 命令行应用程序中将 argv 转换为宽字符?

我在我的程序中使用 C 的 win32 api 从串行端口读取,这似乎是相当低级的东西。假设没有更好的从串行端口读取的方法,CreateFile 函数涉及一个 LPCWSTR 参数,我读过它看起来 LPCWSTR 是一个 wchar_t 类型。首先,我不太了解 wchar 和 char 之间的区别,我读过有关 ansi 和 unicode 的内容,但我真的不知道它如何适用于我的情况。

我的程序使用 main 函数,而不是 wmain,并且需要从命令行获取参数并将其存储在 wchar_t 变量中。现在我知道如果我当场就可以做到这一点;

因为它看起来像 L 将 char 数组转换为 wchar 数组。但是,当我这样做时它不起作用;

显然是因为它是一个语法错误。我想我的问题是,有没有一种简单的方法可以将普通字符串转换为 wchar_t 字符串?

或者有没有办法完全避免这种Unicode的东西,并在Windows上使用C以另一种方式从串行读取..

0 投票
3 回答
2818 浏览

php - 如何转换 htmlentities 符号中的阿拉伯字母?

我需要在 htmlentities 符号中转换阿拉伯字母。代码页:ISO-8859-1。

سك - 例如,这是阿拉伯符号。

返回:

我怎样才能从这个符号中得到 html-entities سك

0 投票
4 回答
2242 浏览

localization - RTF 文件上的 LGHT0311 错误要显示在许可证对话框中

有一个用于 pt-BR 和代码页 860 的 .wxl 文件,出于某种原因,包含用于 pt-PT 和 pt-BR 的 wix UI 其余部分的 wxl 文件正在使用代码页 1252。

错误 LGHT0311:提供的字符串包含指定数据库代码页“1252”中不可用的字符。
将这些字符更改为数据库代码页中存在的字符,或者通过修改以下属性之一来更新数据库的代码页:
. 产品/@Codepage、模块/@Codepage、Patch/@Codepage、PatchCreation/@Codepage 或 WixLocalization/@Codepage。

错误行是它读取 rtf 文件内容的位置。

我发现了设置 Product/@Codepage="!(loc.CodePage)" 的建议,但是它出现在 3.5 中,您不能对该属性使用本地化。

目前其他 12 种语言都可以使用,包括 ja-JP、zh-CN、es-ES。

我正在尝试解决的选项:

  • pt 或 pt-BR 是否有 1 个正确的代码页?
  • 如何判断文本的哪一部分不在代码页中?如何根据代码页 860 或 1252(以适当者为准)指出错误的文本。
  • 如何轻松设置代码页,而不必每次都重新构建产品?
  • 我如何告诉 wix 不要使用内置的 wxl(和代码页),而是使用我想要的?
0 投票
6 回答
36273 浏览

cmd - 永久更改 CMD 中的 CodePage?

我的 Windows cmd CodePage 现在低于 65001。因为我正在做一些 Android 的东西并且需要使用控制台日志,但现在忘记了如何更改它。

使用 chcp 437 将 CodePage 改回时,它可以工作。但是如果我启动一个新的 cmd 窗口,它就会返回。

如何做 chcp 事情以使其永久化?

0 投票
1 回答
969 浏览

c++ - 更改 VS10 中调试控制台的默认代码页

目前它默认为我的系统语言环境,在我的情况下是 932(日语 Shift-JIS),但我希望它默认为 65001(UTF-8)。

我可以通过在代码中的某处插入 SetConsoleOutputCP 行然后将其删除来更改给定程序的默认值,但是对每个程序都这样做非常烦人。

有什么建议么?

0 投票
7 回答
47615 浏览

batch-file - 运行带有重音字符的 BAT/CMD 文件

我有一个 Windows 批处理文件,其中包含在路径包含重音字符的位置执行 EXE 文件的指令。以下是批处理文件的内容。

C:\español\jre\bin\java.exe - 此路径存在且正确。我可以直接在 cmd.exe 上运行这个命令。但是,当我从 bat/cmd 文件运行命令时,它会说“系统找不到指定的路径”失败

解决此问题的一种方法是将代码页设置为 1252(这对我有用)。但是恐怕我们必须为任何非英语语言环境设置代码页,并且确定要使用哪个代码页非常困难。

是否有解决此问题的替代方法?也许是命令行选项或其他东西?

0 投票
2 回答
609 浏览

windows - Windows ANSI Western (cp 1252) 最早出现在哪个 Windows 版本中?

我希望尽可能明确地参考哪个版本的 Windows 引入了 Windows ANSI 西方字符编码。

我的主要嫌疑人是 Windows 1.0(常识)和 Windows 3.1。

Windows 3.1 是由 MSDN 上的 Microsoft 书籍暗示声明的。它指出 Windows 95 使用的编码是在 Windows 3.1 中引入的。我不认为这是任何明确的参考,甚至特别值得信赖,因为它过于模糊并且暗示了一些谎言(例如代码页 437,原始 IBM PC 字符集)。


更新:在http://iana.org/assignments/character-sets我找到了注册的 IANA 名称“ISO-8859-1-Windows-3.0-Latin-1”和“ISO-8859-1-Windows-3.1-Latin -1”。“windows-1252”后来注册(根据某处的讨论)。在我看来,它们都引用了相同的编码,在这种情况下,它似乎至少存在于 Windows 3.0 中。因此(如果为真)使暗示 3.1 的 MS book 声明无效,但仍然存在问题的确切位置