问题标签 [charset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
29 浏览

unicode - 从命令行检测单字节字符集?

我在一个目录中有一堆文本文件。他们有文字,比如说,英语和阿拉伯语 - 或两者兼而有之。仅英语的仅使用 windows-1252 代码页中的字符(或 ISO-8859-1 / Latin-1,如果您愿意),而阿拉伯语则使用 windows-1256(或 iso-8859-6,如果您愿意)。

我的问题:我可以从(Unix'ish)命令行检测哪个文件使用哪个代码页,并且具有不错的可靠性吗?

注意:file -i不要这样做...

0 投票
2 回答
69 浏览

php - Content-Type charset won't change

I'm trying to change my website from windows-1251 to utf-8, but it won't budge.

There are a ton of "solutions" to this on web, but any doesn't seem to be sufficient.

Here is what I did:

  1. I changed the encoding of the index.html (smarty template) and index.php files to UTF-8.

  2. I set

in index.html

  1. I set

in several places in index.php

  1. I changed

in php.ini and restarted my Apache(XAMPP) server

And still, the Chrome devtools say my page is "Content-Type: text/html; charset=windows-1251" and I see gibberish instead of Cyrillic in my browser.

What else can I do?

P.S. my index.html looks like this now:

and I open it dirrectly via the browser: http://localhost:8080/index.html

0 投票
0 回答
44 浏览

php - 在插入 mysql 之前将一个撇号替换为另一个撇号

我通过 WYSIWYG 编辑器 ( https://summernote.org/ ) 输入了一个字符串。我遇到的问题是,当有人从 Google Docs 之类的地方粘贴文本时,它使用撇号如下:

child’s

然后我将其存储在数据库中(字符集:utf8mb4 排序规则:utf8mb4_unicode_ci)

显示数据时,它在 Mac 上的 safari 上显示为带有问号符号,但在 PC 上的 chrome 上显示正常。

我还发送了一封包含该文本的电子邮件,当它击中那个撇号时,它会完全中断电子邮件。

我尝试了以下解决方案,但似乎没有一个对我有帮助:

回声 mb_detect_encoding($str); // 产生 UTF-8

我理想的方法是将字符转换为“常规”撇号,然后再将其存储在数据库中。

我见过类似的问题,并测试了我见过的所有答案(包括那些没有被选为接受的答案,但没有一个有效的答案)

通过 AWS 简单电子邮件服务使用 PHPMailer

看来以下作品可用于替换撇号

0 投票
0 回答
67 浏览

html - Webpack 更改 CSS 样式中的字符集

我有一个 CSS 文件,我需要将其导入到我的应用程序中。我的问题是 Webpack 将字符串替换"\f2e9"为不可读的东西。

例如。这是我导入的样式表的一部分:

这就是它在捆绑的 CSS 文件中的样子:

在原始文件中,我可以修改content. 但在捆绑文件中,它是单个字符。

这是我的 Webpack 配置:


我该如何预防?

0 投票
0 回答
13 浏览

fonts - 为什么在使用 WebFonts 时有时会得到不同的结果?

我正在使用通过使用以下 WebFonts 部署到 Azure Linux Functions 的 PuppeteerSharp。我不能保证打印出不同语言的所有字符的 PDF 输出。

但是,打印的 PDF 具有不同的输出:

案例 1:大多数时候打印的 PDF 仅包含拉丁字符:

案例 2:缺少高棉字符:

Case3:打印所有语言字符:

0 投票
2 回答
75 浏览

java - Tomcat 9 欢迎文件编码错误

我有一个 index.html 文件:

我将它部署到由 Tomcat 9.0.35 服务的战争中。问题是在浏览器中,重音是这样的:“Annuaire Téléphonique”

我发现Tomcat服务的内容类型是假的:

每个 Tomcat 配置都配置为 UTF-8。我的 Linux bash 定义 LANG=UTF-8,Tomcat 以 -Dfile.encoding=UTF-8 启动

我还发现,在询问表单 index.html 时,tomcat 没有指定编码,这对我来说是完美的,因为 index.html 本身包含 UTF-8 的 Content-Type 元数据,浏览器正确显示重音

问题是:

  • 为什么 index.html 作为欢迎文件(http://127.0.0.1:10000/)被作为 ISO-8859-1 服务?
  • 它如何用作 UTF-8 ?(AddDefaultCharsetFilter UTF-8 没有帮助)

谢谢你的帮助

0 投票
1 回答
32 浏览

php - 将 MySQL 字段字符集从 latin1 更改为 utf8_general_ci 打破变音符号 (ä,ö,ü)

我正在构建一个以前必须处理英语和德语文本的应用程序。现在我也添加了将文本翻译成俄语和中文的功能。但似乎西里尔文和中文字符无法保存在默认的 lating1 字符集中。我使用 PHPMyAdmin 将我的字符集切换为 utf8_general_ci。它可以找到,我可以使用每个需要的字符保存新内容。

问题在于,每个像 ä,ö,ü 这样的旧变音符号都被替换为 ?。它是有线的,因为如果我再次输入变音符号以将其保存到数据库中,它可以正常工作。因此,字符集的更改似乎将每个变音符号转换为“?”。

有人可以指出我可以更改字符集但不破坏所有旧内容的方向吗?

谢谢!

0 投票
1 回答
65 浏览

java - 将字节数组从一种编码转换为另一种 java

大家好,我应该将此代码转换为 Java 中的 C#。你能帮我一把吗?

我试图像这样将它转换为java。但结果不同:

我究竟做错了什么?

0 投票
0 回答
19 浏览

html - 来自桌面客户端的 SAML 身份验证

我们有一个桌面客户端,它使用 SAML Auth (O365) 连接到我们的应用程序。我们仅从客户端 O365 身份验证随机连接时遇到问题。以下是我们收到的错误,但我们似乎无法弄清楚为什么它有时会发生。我们使用 SAML 从我们的 O365 帐户到同一环境进行身份验证的管理员帐户似乎无法复制客户端在尝试连接时遇到的情况。该应用程序托管在托管在 Linux 服务器上的 tomcat 中。

内容类型 text/html;响应消息的 charset=utf-8 与绑定的内容类型不匹配 (text/xml; charset=utf-8)。如果使用自定义编码器,请确保正确实现 IsContentTypeSupported 方法。响应的前 1024 个字节是

0 投票
0 回答
9 浏览

mysql - 第 51201 行出错:) ENGINE=MyISAM DEFAULT CHARSET=latin1;

当我想从 phpmyadmin 使用 bigdump 和备份 sql 恢复备份我的数据库时,我需要帮助来了解问题出在哪里。文件但此错误:

第 51201 行出错:) ENGINE=MyISAM DEFAULT CHARSET=latin1;

询问:

MySQL:“密码日期”的默认值无效