问题标签 [file-encodings]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vim - 如何完全关闭 vim 重新编码文件的能力?
我发现的每个与编码相关的问题都是关于如何重新编码文件。
但是,我的情况恰恰相反——有可能让 vim 根本不重新编码文件吗?(以及如何,如果是的话?)
有时是写[converted]
在状态栏,总是错过。但是,我将终端设置为与编辑文件相同的编码,因此,我根本不需要重新编码。
php - 以 UTF-8 保存我的所有源代码文件有什么缺点吗?
如果这是相关的(很可能是),它们就是 PHP 源代码文件。
file-encodings - 未知文件编码
我有一个带有一些我不确定的编码的配置文件。我将如何对其进行解码以使其可读?
这是一个示例:
java - 如何在java中更改文件编码表
我有我的代码来检查编码表:
当我从 Windows 启动时,我得到带有 cp1250 的文本文件,当我从嵌入式系统启动时,我得到带有 cp852 的文本文件。在 Windows 中,我设置了代码页 852。在 Eclipse 中,我设置了 cp852。一些解决方案?
php - PHP中的空格导致无意义的错误?
我正在编辑 WordPress 主题的 functions.php 文件,每当我编辑它时,即使编辑添加了一个空格,服务器也会返回
错误:
这是我添加单个空格的地方:
然后一切都死了。这不是一个一致的错误,因为在我用备份的文件替换整个 functions.php 文件后它就消失了。只有在我编辑文件时才会复制它,也就是说,即使使用单个空格字符也会出现。我正在使用 NetBeans 和 CuteFTP 编辑然后上传文件。
到底是怎么回事?!这一定与某种文件质量本身有关,因为从代码的角度来看,代码完全相同……或者我的服务器。
解决方案:
Netbeans 默认为每个项目使用特定的文件编码。外部文件可能具有不同的编码,这可能会导致问题。将外部文件的内容写入您通过 Netbeans 创建的新空白文件。
python - 我应该确保我所有的 Web 应用程序代码都是 UTF-8 吗?
我有一个只包含英语语言字符串的 Django 站点。我将把它本地化为其他语言。我没有设置任何类型的文件编码选项。是否需要将我所有的 Python 代码转换为 UTF-8?这是一个好习惯吗?如果是这样,我是否需要将文件实际转换为 UTF-8,还是只需将此代码段添加到我的每个 Python 文件中# -*- coding: utf-8 -*-
谢谢。
python - 不一致的文件行为
我正在尝试在以下日志行中追踪 Python UnicodeDecodeError:
我在 Vim 中打开了整个日志文件,然后将这一行拉到一个新文件中,这样我就可以只测试一行。但是,我的解析脚本适用于新文件 - 它不会引发 UnicodeDecodeError。我不明白为什么一个文件会产生错误而另一个不会,当它们(表面上)相同时。
这是我尝试过的:运行enca
以确定文件编码,它抱怨Cannot determine (or understand) your language preferences.
file -i
说这两个文件都是Regular file
s。我还删除了原始日志文件中的每一行,但一个文件中仍然出现错误,另一个文件中没有错误。我尝试删除
从我的 .vimrc 中,再次写入文件,我仍然在一个文件中得到错误,而在另一个文件中没有。
日志是 nginx 日志。Nginx 在他们的发行说明中有这个说明:
我的 Python 脚本有with open('log_file') as f
,当我尝试调用json.dumps
dict 时出现错误。
我怎样才能找到这个?
python - 循环遍历文件扩展名,寻找非 ASCII 字符 - Python
我编写了一个 Python 小程序,它通过目录(及其子目录)查找包含非 ASCII 字符的文件。
我想改进它。我知道这个“目录”中的某些文件可能是 ZIP、DTA/OUT、OMX、SFD/SF3 等......应该包含非 ASCII 字符的文件。所以我想知道这些在那里并筛选那些不应该包含 ASCII 字符的文件,因为我的最终目标是找到不应该包含非 ASCII 字符的文件并删除它们(带有 TB 值的坏扇区的损坏磁盘重要数据)。
我的想法是进一步查看 Python 中 try/except 块的“except”部分中的文件,如下所示:
当我开始编写代码时,我意识到循环询问文件是'.zip'
还是'.sfd'
pr'.omx'
等等......将是一个笨重的程序并且永远需要。
有没有办法逐个搜索一组文件扩展名?也许包含这些扩展名的文件要检查?还是我没有想到的?如果这是一个愚蠢的问题,我提前道歉,但是 Python 中有这么多很酷的函数,我敢肯定我错过了一些可以提供帮助的东西。
干杯。
windows - Windows PowerShell 和 CMD.exe 中的 PerlIO
显然,我的 Perl 脚本会产生两个不同的输出文件,具体取决于我是在 Windows PowerShell 还是 cmd.exe 下运行它。该脚本可以在这个问题的底部找到。文件句柄以 . 打开IO::File
,我相信 PerlIO 正在做一些棘手的事情。cmd.exe
与生成几乎两倍大小的文件 (8.19 KB) 的 PowerShell 相比,似乎在选择的编码下是更紧凑的编码 (4.09 KB)。该脚本采用一个 shell 脚本并生成一个 Windows 批处理文件。似乎在下面生成cmd.exe
的只是常规 ASCII(1 字节字符),而另一个似乎是 UTF-16(前两个字节FF FE
)
有人可以验证并解释为什么 PerlIO 在 Windows Powershell 下的工作方式与 cmd.exe 不同吗?另外,如何使用 ASCII 魔术 PerlIO 文件句柄显式获取IO::File
?
目前,只有生成的文件cmd.exe
是可执行的。UTF-16 .bat
(我认为这是编码)不能由 PowerShell 或 cmd.exe 执行。
顺便说一句,我们将 Perl 5.12.1 用于 MSWin32
c# - 检测文件是否包含文本
为了更好地理解多线程和异步任务,我用 C# 编写了一个简单的应用程序来计算项目(目录)中的代码总行数。
目前,我打开一个文件并计算每个文件中的行数。但是,这包括所有文件(jpg、png、exe 等)。有没有办法可以检测文件是否为文本文件?可能通过检测 ASCII 编码或类似的东西。