问题标签 [file-encodings]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 在 C# 中读取时从不同的编码文件中删除“�”
我无法控制我们的一些客户保存文件的编码,当它是 ASCII 时,文件可能缺少然后显示“�”的字符。读取文件后,如何删除这些字符“�”?
我正在阅读带有以下行的文件,但对于每一列,我想用 C# .NET 中的空格替换该字符。
r - 写为 CSV 给出奇怪的字符
我正在尝试将数据帧编写为 csv,它成功了,但最终会出现一些带有奇怪字符的字段,例如 4.5×10−7 在 csv 文件中给出 4.5×10â^7。在做了一些研究之后,我将 fileEncoding 用作“Windows-1252”,但这很有帮助。这是一个可重现的代码
任何人都可以帮助我使用正确的编码或替代方法来照顾该领域吗?
visual-studio - Visual Studio Code:按文件夹设置文件编码
在 Visual Studio Code(社区版本 1.17.2)中,我在工作设置(settings.json)中配置了文件编码,如下所示:
尽管如此,在我的工作空间中的特定文件夹中,我需要一些带有 iso88591 编码的脚本。我可以在与我的工作设置中指定的不同的特定文件夹中指定编码吗?
groovy - 查找和替换文件中的特殊字符
我正在尝试在以 ISO-8859-1 编码的文件中查找和替换一些特殊字符,然后将结果写入以 UTF-8 编码的新文件:
我的输入文件内容是:
"þ": "ý": "Þ":" "ð":" "Ý":" "Ð":"
问题是我的代码永远找不到指定的字符。groovy 脚本文件本身以 UTF-8 编码。我猜这可能是问题的原因,但是我不能在 ISO-8859-1 中对其进行编码,因为那时我不能在其中写“Ş”“Ğ”等。
json - 在 lumen API 的 json_payload 中以 base64_encoded 格式发送图像
我从前端AJAX请求以JSON_PAYLOAD中的base64_encoded格式发送图像,另一方面,我使用LUMEN API接受该请求,获取文件并将其存储在具有LONGBLOG类型的字段中的 db 中,但问题是当我转储我的用于查看前端发送的有效负载的 API 方法,它什么也不转储。
我的有效载荷是:
这是api方法。
它给出了调用未定义对象的错误,并且仅在转储时dd($request)
转储为空
CORS已启用。我还尝试将内容类型启用为 base_64。
r - 无法使用 r 编程读取临时文件,文件编码错误
使用 R 编程
我有两组数据(securityj 和 securityc)。我想找到cosine
它们之间的相似度值
我使用了这段代码lsa library
运行时出现此错误(textmatrix(securityfile))
FUN(X[[i]], ...) 中的错误:[lsa] - 由于文件的编码问题,无法打开文件 C:\Users\AAA\AppData\Local\Temp\RtmpIDmcl7\file1898438fde2/D1。
在处理数据库文件时它运行得非常好,但是对于安全文件我有错误,并且数据是从同一个原始文件中获取的。问题是我创建了文件然后立即读取它。我尝试更改原始文件编码并确保它是 UTF-8 但没有任何改变
textmatrix
是 中的一个函数lsa library
。我的数据是从清理过的招聘广告中获取的两个二元组列表,(databasej,databasec)和(securityj,securityc)都来自同一个文本文件,它在第一个文件中有效,但在第二个文件中出现错误。对于分隔符 sep="/" ,它与文档中所需的函数相同。
securityj 中的样本输入
character-encoding - 为什么选择 EUC-JP 而不是 UTF-8 或 SHIFT-JIS?
我一直在与一家日本公司合作,该公司选择使用 EUC-JP 对我们的文件进行编码。我已经好奇了很长一段时间,并尝试询问上级为什么 EUC-JP 而不是 SHIFT-JIS 或 UTF-8,但得到的答案是“就像它的约定之类的”。您知道为什么最初的编码人员可能会选择 EUC-JP 而不是其他字符编码吗?
java - java文件读写,编码失败
我遇到了一个问题,java 读取我的文件,在 notepad++ 中它显示 UCS-2 LE BOM 编码,我正在尝试将其中的选项卡更改为逗号。转换后,每个字符后面都有一个 NUL,并且在文件的开头有“��”字符。基本上,编码失败。目前,我正在使用此代码将文件从选项卡式 csv 转换为逗号分隔的 csv。
这里可能会失败什么?在您发表评论之前 - 我无法重新制作程序以处理制表符分隔的文件。
java - 错误需要修复 - javax.crypto.BadPaddingException:给定最终块未正确填充
我不确定我做错了什么。简而言之,我想使用给定的 secretKey 并使用 iv 解密文件,我正在使用以下代码:
这会返回一个输出,例如?lm:@?ڤ?w?)P@?\?s????Ka???0??{???w|k???o?\?
. 我已经尝试过 UTF-8 解码。但直到现在仍然没有运气。有人对这个有任何线索吗?
javascript - JavaScript 如何确保使用 Unicode 字符集编写程序?
我在阅读一本 JavaScript 书籍时发现了这句话:
JavaScript 程序是使用 Unicode 字符集编写的
我不明白的是,JavaScript 文件如何确保我在.js
文件中写入的任何内容都是 Unicode 字符集?
这是否意味着每当我在计算机上使用键盘键入时,它总是使用 Unicode?它是如何工作的?