问题标签 [encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
15315 浏览

encoding - 如何在经典 ASP 中使用 XMLHttp 对象为 POST 设置字符集?

我必须在经典 ASP 中使用 XMLHttp 对象,以便通过 HTTP 从服务器到服务器将一些数据发送到另一台服务器:

我被告知(消费服务器的维护者),根据我是使用 Windows Server 2000 (IIS 5) 还是 Windows Server 2003 (IIS 6) 中的代码,他会得到Latin-1 (Windows 2000 Server)或UTF-8 (Windows Server 2003) 编码的数据。

我没有找到任何属性或方法来设置我必须发送的数据字符集。它是否依赖于某些 Windows 配置或脚本 (asp) 设置?

0 投票
9 回答
134357 浏览

python - 如何在 Python 中将文件转换为 utf-8?

我需要在 Python 中将一堆文件转换为 utf-8,并且在“转换文件”部分遇到问题。

我想做相当于:

谢谢!

0 投票
3 回答
3492 浏览

java - 如何在属性文件中正确存储和检索国际化字符串?

我正在通过制作一个使用属性文件 + ResourceBundle 来获取不同字符串的 Hello World 程序来试验国际化。

具体来说,我有一个存储“hello.world=Hello World!”的文件“messages_en_US.properties”,当然可以正常工作。

然后我有一个文件“messages_ja_JP.properties”,我已经尝试了各种方法,但是当打印到控制台或 Swing 中时,它总是显示为某种类型的乱码。问题显然在于将内容读入 Java 字符串,因为直接输入源代码的日文 Java 字符串可以正常打印。

我尝试过的事情:

  • 采用 UTF-8 编码的 .properties 文件,其值按原样使用日语字符串。我读到的东西表明Java希望属性文件处于系统的本机编码中......?无论如何,它都不起作用。
  • 默认编码 (ISO-8859-1) 中的文件和存储为转义 Unicode 的值,由 Java 中包含的 native2ascii 程序创建。尝试使用各种日语编码的源文件... SHIFT-JIS、EUC-JP、ISO-2022-JP。

编辑:

实际上,我在键入此内容时就想到了这一点,但我想无论如何我都会将其发布并回答以防万一。

0 投票
7 回答
4641 浏览

c# - 生成用户特定的 1 次优惠券代码

因此,我需要生成一个代码,该代码可以与特定用户/潜在客户相关联,并内置美元金额。它需要是可逆的,以便客户端应用程序可以确认代码的有效性并应用经理想要的折扣。

我想让代码尽可能短,但它需要被很好地混淆,这样销售人员就不能自己开始弄乱它。

我可以自己想出一些数字,除以 pi 并转换为十六进制等等,但我会对社区的想法或最佳实践非常感兴趣。

我在 C# 中执行此操作,但我希望可以翻译任何语言的方法。

编辑:澄清。我不能提前存储这些东西,代码必须即时构建并携带所有信息。

例如。推销员 14 打电话给客户 773,希望给他们 500 美元的订单折扣。14、773 和 500 必须在优惠券代码中,并且能够在销售人员键入代码后在客户端应用程序中提取。

0 投票
5 回答
3204 浏览

python - 处理包含多个字符编码的字符串

我不确定如何真正问这个问题,而且我离找到答案还很遥远,所以我希望有人能帮助我。

我正在编写一个 Python 应用程序,它连接到远程主机并接收返回的字节数据,我使用 Python 的内置 struct 模块对其进行解包。我的问题是字符串,因为它们包含多个字符编码。以下是此类字符串的示例:

"^L这是一个示例 ^Gstring 具有多个 ^J 字符编码"

使用特殊转义字符标记不同编码开始和结束的位置:

  • ^L - 拉丁语1
  • ^E - 中欧
  • ^T - 土耳其语
  • ^B - 波罗的海
  • ^J - 日语
  • ^C - 西里尔字母
  • ^G - 希腊语

等等......我需要一种将这种字符串转换为 Unicode 的方法,但我真的不知道该怎么做。我已经阅读了 Python 的编解码器和 string.encode/decode,但我真的一点也不聪明。我还应该提到,我无法控制主机如何输出字符串。

我希望有人可以帮助我了解如何开始。

0 投票
7 回答
78458 浏览

java - 如何在 Java/Eclipse 中使用特殊字符

如何在 Java/Eclipse 中使用/显示 ♥、♦、♣ 或 ♠ 等字符?

当我尝试直接使用它们时,例如在源代码中,Eclipse 无法保存文件。

我能做些什么?

编辑:如何找到 unicode 转义序列?

0 投票
20 回答
439892 浏览

encoding - What is base 64 encoding used for?

I've heard people talking about "base 64 encoding" here and there. What is it used for?

0 投票
4 回答
28769 浏览

python - 如何在 Python 中对 PDF 文件进行 base64 编码

我应该如何对 PDF 文件进行 base64 编码,以便在 Python 中通过 XML-RPC 进行传输?

0 投票
3 回答
2195 浏览

c# - C#:在控制台中字符显示不好,为什么?

下图说明了一切:

替代文字 http://img133.imageshack.us/img133/4206/accentar9.png

变量 textInput 来自,File.ReadAllText(path);并且像 : ' é è ... 这样的字符不显示。当我运行我的 UnitTest 时,一切都很好!我看到他们...为什么?

0 投票
3 回答
5722 浏览

java - 修复 XML 文件中的错误编码

我们的供应商之一有时会发送标记为 UTF-8 编码文档但包含未包含在 UTF-8 字符集中的字符的 XML 提要。这会导致解析器在遇到这些字符时抛出异常并停止构建 DOM 对象:

抛出以下异常:

有没有办法尽早“捕获”这些问题并避免异常(即从流中查找和删除这些字符)?我正在寻找的是错误编码文档的“尽力而为”类型的后备。正确的解决方案显然是从源头上解决问题并确保只交付正确的文档,但是当不可能时,有什么好的方法呢?