问题标签 [file-encodings]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2387 浏览

vim - 如何完全关闭 vim 重新编码文件的能力?

我发现的每个与编码相关的问题都是关于如何重新编码文件。

但是,我的情况恰恰相反——有可能让 vim 根本不重新编码文件吗?(以及如何,如果是的话?)

有时是写[converted]在状态栏,总是错过。但是,我将终端设置为与编辑文件相同的编码,因此,我根本不需要重新编码。

0 投票
4 回答
665 浏览

php - 以 UTF-8 保存我的所有源代码文件有什么缺点吗?

如果这是相关的(很可能是),它们就是 PHP 源代码文件。

0 投票
1 回答
324 浏览

file-encodings - 未知文件编码

我有一个带有一些我不确定的编码的配置文件。我将如何对其进行解码以使其可读?

这是一个示例:

0 投票
1 回答
1351 浏览

java - 如何在java中更改文件编码表

我有我的代码来检查编码表:

当我从 Windows 启动时,我得到带有 cp1250 的文本文件,当我从嵌入式系统启动时,我得到带有 cp852 的文本文件。在 Windows 中,我设置了代码页 852。在 Eclipse 中,我设置了 cp852。一些解决方案?

0 投票
2 回答
437 浏览

php - PHP中的空格导致无意义的错误?

我正在编辑 WordPress 主题的 functions.php 文件,每当我编辑它时,即使编辑添加了一个空格,服务器也会返回

错误:

这是我添加单个空格的地方:

然后一切都死了。这不是一个一致的错误,因为在我用备份的文件替换整个 functions.php 文件后它就消失了。只有在我编辑文件时才会复制它,也就是说,即使使用单个空格字符也会出现。我正在使用 NetBeans 和 CuteFTP 编辑然后上传文件。

到底是怎么回事?!这一定与某种文件质量本身有关,因为从代码的角度来看,代码完全相同……或者我的服务器。

解决方案:
Netbeans 默认为每个项目使用特定的文件编码。外部文件可能具有不同的编码,这可能会导致问题。将外部文件的内容写入您通过 Netbeans 创建的新空白文件。

0 投票
1 回答
101 浏览

python - 我应该确保我所有的 Web 应用程序代码都是 UTF-8 吗?

我有一个只包含英语语言字符串的 Django 站点。我将把它本地化为其他语言。我没有设置任何类型的文件编码选项。是否需要将我所有的 Python 代码转换为 UTF-8?这是一个好习惯吗?如果是这样,我是否需要将文件实际转换为 UTF-8,还是只需将此代码段添加到我的每个 Python 文件中# -*- coding: utf-8 -*-

谢谢。

0 投票
1 回答
181 浏览

python - 不一致的文件行为

我正在尝试在以下日志行中追踪 Python UnicodeDecodeError:

我在 Vim 中打开了整个日志文件,然后将这一行拉到一个新文件中,这样我就可以只测试一行。但是,我的解析脚本适用于新文件 - 它不会引发 UnicodeDecodeError。我不明白为什么一个文件会产生错误而另一个不会,当它们(表面上)相同时。

这是我尝试过的:运行enca以确定文件编码,它抱怨Cannot determine (or understand) your language preferences. file -i说这两个文件都是Regular files。我还删除了原始日志文件中的每一行,但一个文件中仍然出现错误,另一个文件中没有错误。我尝试删除

从我的 .vimrc 中,再次写入文件,我仍然在一个文件中得到错误,而在另一个文件中没有。

日志是 nginx 日志。Nginx 在他们的发行说明中有这个说明:

我的 Python 脚本有with open('log_file') as f,当我尝试调用json.dumpsdict 时出现错误。

我怎样才能找到这个?

0 投票
1 回答
348 浏览

python - 循环遍历文件扩展名,寻找非 ASCII 字符 - Python

我编写了一个 Python 小程序,它通过目录(及其子目录)查找包含非 ASCII 字符的文件。

我想改进它。我知道这个“目录”中的某些文件可能是 ZIP、DTA/OUT、OMX、SFD/SF3 等......应该包含非 ASCII 字符的文件。所以我想知道这些在那里并筛选那些不应该包含 ASCII 字符的文件,因为我的最终目标是找到不应该包含非 ASCII 字符的文件并删除它们(带有 TB 值的坏扇区的损坏磁盘重要数据)。

我的想法是进一步查看 Python 中 try/except 块的“except”部分中的文件,如下所示:

当我开始编写代码时,我意识到循环询问文件是'.zip'还是'.sfd'pr'.omx'等等......将是一个笨重的程序并且永远需要。

有没有办法逐个搜索一组文件扩展名?也许包含这些扩展名的文件要检查?还是我没有想到的?如果这是一个愚蠢的问题,我提前道歉,但是 Python 中有这么多很酷的函数,我敢肯定我错过了一些可以提供帮助的东西。

干杯。

0 投票
1 回答
735 浏览

windows - Windows PowerShell 和 CMD.exe 中的 PerlIO

显然,我的 Perl 脚本会产生两个不同的输出文件,具体取决于我是在 Windows PowerShell 还是 cmd.exe 下运行它。该脚本可以在这个问题的底部找到。文件句柄以 . 打开IO::File,我相信 PerlIO 正在做一些棘手的事情。cmd.exe与生成几乎两倍大小的文件 (8.19 KB) 的 PowerShell 相比,似乎在选择的编码下是更紧凑的编码 (4.09 KB)。该脚本采用一个 shell 脚本并生成一个 Windows 批处理文件。似乎在下面生成cmd.exe的只是常规 ASCII(1 字节字符),而另一个似乎是 UTF-16(前两个字节FF FE

有人可以验证并解释为什么 PerlIO 在 Windows Powershell 下的工作方式与 cmd.exe 不同吗?另外,如何使用 ASCII 魔术 PerlIO 文件句柄显式获取IO::File

目前,只有生成的文件cmd.exe是可执行的。UTF-16 .bat(我认为这是编码)不能由 PowerShell 或 cmd.exe 执行。

顺便说一句,我们将 Perl 5.12.1 用于 MSWin32

0 投票
3 回答
2453 浏览

c# - 检测文件是否包含文本

可能重复:
如何确定文件是 C# 中的二进制文件还是文本文件?
C# - 检查文件是否基于文本

为了更好地理解多线程和异步任务,我用 C# 编写了一个简单的应用程序来计算项目(目录)中的代码总行数。

目前,我打开一个文件并计算每个文件中的行数。但是,这包括所有文件(jpg、png、exe 等)。有没有办法可以检测文件是否为文本文件?可能通过检测 ASCII 编码或类似的东西。