问题标签 [file-encodings]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
97 浏览

c# - 在 C# 中读取时从不同的编码文件中删除“�”

我无法控制我们的一些客户保存文件的编码,当它是 ASCII 时,文件可能缺少然后显示“�”的字符。读取文件后,如何删除这些字符“�”?

我正在阅读带有以下行的文件,但对于每一列,我想用 C# .NET 中的空格替换该字符。

0 投票
1 回答
3102 浏览

r - 写为 CSV 给出奇怪的字符

我正在尝试将数据帧编写为 csv,它成功了,但最终会出现一些带有奇怪字符的字段,例如 4.5×10−7 在 csv 文件中给出 4.5×10â^7。在做了一些研究之后,我将 fileEncoding 用作“Windows-1252”,但这很有帮助。这是一个可重现的代码

任何人都可以帮助我使用正确的编码或替代方法来照顾该领域吗?

0 投票
0 回答
1087 浏览

visual-studio - Visual Studio Code:按文件夹设置文件编码

在 Visual Studio Code(社区版本 1.17.2)中,我在工作设置(settings.json)中配置了文件编码,如下所示:

尽管如此,在我的工作空间中的特定文件夹中,我需要一些带有 iso88591 编码的脚本。我可以在与我的工作设置中指定的不同的特定文件夹中指定编码吗?

0 投票
1 回答
87 浏览

groovy - 查找和替换文件中的特殊字符

我正在尝试在以 ISO-8859-1 编码的文件中查找和替换一些特殊字符,然后将结果写入以 UTF-8 编码的新文件:

我的输入文件内容是:

"þ": "ý": "Þ":" "ð":" "Ý":" "Ð":"

问题是我的代码永远找不到指定的字符。groovy 脚本文件本身以 UTF-8 编码。我猜这可能是问题的原因,但是我不能在 ISO-8859-1 中对其进行编码,因为那时我不能在其中写“Ş”“Ğ”等。

0 投票
0 回答
191 浏览

json - 在 lumen API 的 json_payload 中以 base64_encoded 格式发送图像

我从前端AJAX请求以JSON_PAYLOAD中的base64_encoded格式发送图像,另一方面,我使用LUMEN API接受该请求,获取文件并将其存储在具有LONGBLOG类型的字段中的 db 中,但问题是当我转储我的用于查看前端发送的有效负载的 API 方法,它什么也不转储。

我的有效载荷是:

这是api方法。

它给出了调用未定义对象的错误,并且仅在转储时dd($request)转储为空

CORS已启用。我还尝试将内容类型启用为 base_64。

0 投票
2 回答
416 浏览

r - 无法使用 r 编程读取临时文件,文件编码错误

使用 R 编程

我有两组数据(securityj 和 securityc)。我想找到cosine它们之间的相似度值

我使用了这段代码lsa library

运行时出现此错误(textmatrix(securityfile))

FUN(X[[i]], ...) 中的错误:[lsa] - 由于文件的编码问题,无法打开文件 C:\Users\AAA\AppData\Local\Temp\RtmpIDmcl7\file1898438fde2/D1。

在处理数据库文件时它运行得非常好,但是对于安全文件我有错误,并且数据是从同一个原始文件中获取的。问题是我创建了文件然后立即读取它。我尝试更改原始文件编码并确保它是 UTF-8 但没有任何改变

textmatrix是 中的一个函数lsa library。我的数据是从清理过的招聘广告中获取的两个二元组列表,(databasej,databasec)和(securityj,securityc)都来自同一个文本文件,它在第一个文件中有效,但在第二个文件中出现错误。对于分隔符 sep="/" ,它与文档中所需的函数相同。

securityj 中的样本输入

0 投票
1 回答
3166 浏览

character-encoding - 为什么选择 EUC-JP 而不是 UTF-8 或 SHIFT-JIS?

我一直在与一家日本公司合作,该公司选择使用 EUC-JP 对我们的文件进行编码。我已经好奇了很长一段时间,并尝试询问上级为什么 EUC-JP 而不是 SHIFT-JIS 或 UTF-8,但得到的答案是“就像它的约定之类的”。您知道为什么最初的编码人员可能会选择 EUC-JP 而不是其他字符编码吗?

0 投票
0 回答
252 浏览

java - java文件读写,编码失败

我遇到了一个问题,java 读取我的文件,在 notepad++ 中它显示 UCS-2 LE BOM 编码,我正在尝试将其中的选项卡更改为逗号。转换后,每个字符后面都有一个 NUL,并且在文件的开头有“��”字符。基本上,编码失败。目前,我正在使用此代码将文件从选项卡式 csv 转换为逗号分隔的 csv。

这里可能会失败什么?在您发表评论之前 - 我无法重新制作程序以处理制表符分隔的文件。

0 投票
1 回答
140 浏览

java - 错误需要修复 - javax.crypto.BadPaddingException:给定最终块未正确填充

我不确定我做错了什么。简而言之,我想使用给定的 secretKey 并使用 iv 解密文件,我正在使用以下代码:

这会返回一个输出,例如?lm:@?ڤ?w?)P@?\?s????Ka???0??{???w|k???o?\?. 我已经尝试过 UTF-8 解码。但直到现在仍然没有运气。有人对这个有任何线索吗?

0 投票
1 回答
53 浏览

javascript - JavaScript 如何确保使用 Unicode 字符集编写程序?

我在阅读一本 JavaScript 书籍时发现了这句话:

JavaScript 程序是使用 Unicode 字符集编写的

我不明白的是,JavaScript 文件如何确保我在.js文件中写入的任何内容都是 Unicode 字符集?

这是否意味着每当我在计算机上使用键盘键入时,它总是使用 Unicode?它是如何工作的?