问题标签 [gbk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 为什么Mac中的R&Studio无法导入带有中文内容的RData(win10创建)
我整天都在追逐这个问题。
我通过以下网址下载了一本教科书的练习材料:http://www.crupjcom.cn/UploadFiles/jxkj/gsgl/243184/采购基础R第二版例题和习题数据.rar
但是,这些RData在win10的R&Rstudio中运行良好,而在Mac中无法显示汉字
win10中的工作室:
Mac 中的工作室
汉字崩溃
Mac 中的 R 控制台
汉字崩溃
我在网站上搜索了很多解决方案,其中大部分是关于如何解决导入“.csv”文档的问题。但我的问题是如何将 RData 加载到 R 中而不会导致中文字符崩溃。
一些答案提到我们应该将Rstudio的“全局选项”中的“默认文本编码”切换为“UTF-8”,但我在Mac和Win10中检查了Rstudio,它们都处于“UTF-8”模式。
因此,我真的不知道真正的问题是什么。
c++ - 如何将windows-936写入日志当wchar_t在代码中通过boost.log
,sample.log被解析为 utf8。现在想在windows.936上写,但是下面的代码没用。
例如"汉字"
sample.log中的 是0xe6b189 0xe5ad97
,解析为utf8。但我希望"汉字"
sample.log中的 应该是0xbaba 0xd7d6
,解析为windows-936(同GBK,GB2312)。你可以帮帮我吗?
unicode - 计算机如何以正确的编码在屏幕上显示字符?
我对计算机中字符的编码感兴趣。
当我打开我xxx.c
的 with 时visual studio code
,VS 代码如何检测我的文件的编码并解释这些“01”序列。进一步,Visual Studio 代码(甚至计算机系统)如何根据我的“01”序列文件和字符编码在屏幕上显示字符?
谢谢!
我在项目中也使用中文。有时,文件编码真的让我发疯。有时,例如,我utf-8
通过编辑创建的正确文件A
被某些B
将其解释为GBK
文件的文本编辑器破坏了,并且编辑A
永远无法将其恢复正确。
我搜索了很多,但大多数答案似乎太抽象或无关紧要。我想弄清楚软件和计算机系统(或操作系统)如何协同工作来完成这项简单但重要的工作!
python - 如何从选定的 pandas.df 行开始一个 for 循环?
使用 for 循环处理 pandas.df 时。我通常会遇到错误。删除错误后,我将不得不从数据帧的开头重新启动 for 循环。如何从错误位置开始 for 循环,摆脱重复运行它。例如:
在上面的代码中,我试图通过 api 进行情感分析并将它们存储到一个列表中。但是,api 只输入 GBK 格式,而我的数据是用 utf-8 编码的。所以它通常会遇到这样的错误:
所以我必须手动删除像'\u30fb'这样的特定项目并重新启动for循环。此时,列表“senti”已经包含了很多数据,所以我不想放弃它们。我能做些什么来改进 for 循环?
unicode - Inno Setup:以 UTF8 录制/恢复文件路径
我们正在使用 Inno Setup(unicode 版本)为我们的产品创建资源包(或“样本”)。我们产品的程序部分通过示例安装程序编写的文件知道示例的位置。目前,它以简单的方式实现:
这种简单的方式有一个致命的问题:安装程序是在中文 Windows 中运行的,整个东西都是 GBK 编码的,但是我们的产品是建立在 UTF8 基础上的。
经过一番搜索,我通过WideCharToMultiByte
在 Pascal 代码中调用 Windows 得到了一些解决方案。但是这行不通,因为它需要 UTF16 作为输入,但我拥有的是 GBK。
此外,Inno Setup 也不适用于我SamplePath.txt中现有的 UTF8 文件名。如果我手动编辑SamplePath.txt文件以填充 UTF8 编码的中文字母,并app
使用以下代码初始化内置函数,它会在 dir 选择页面中显示杂乱的字符:
那么有没有办法在 UTF8 中加载/存储带有 i18n 字符的文件名?
python - 使用 exec(open('file.py').read()) 时 Pycharm 中的非法多字节序列
我正在使用 PyCharm 运行代码:
在运行一些文件时,我得到了:
UnicodeDecodeError:“gbk”编解码器无法解码位置 2655 中的字节 0xa7:非法多字节序列
有朋友可以帮忙吗?
python - 关于 python 和 C++ 之间的编码问题
我使用 python3.8 和 C++,G++ 用于 C++。如果我在 C++ 程序中编写中文(Unicode)字符串,当我运行程序时它会显示错误的字符串,如下所示:
但是,运行它:
虽然可能你不懂中文,但你可以看出它不是我想要的字符串。
如果我将编码更改为“gbk”,这个问题就解决了,但是当我运行python时又出现了另一个问题:
结果:
顺便说一句,这是我关于编码的 vimrc(Gvim 的配置)的一部分:
如何找到 C++ 和 Python 字符串都可以正确编码的编码?我使用 Gvim 在 Windows 中编辑我的 C++ 和 Python 代码,感谢您的帮助!
java - 错误的字符集?Java 程序从 args[0] 获取损坏的字符串
我在 Windows 10 中运行我的 java 程序(默认字符集:Big5)。然后我从 args[0] 中得到了垃圾字符串。
我发现使用任何类型的字符集都很难将损坏的字符串(args[0])转换为可读字符串。
IDE(UTF-8)-->JVM(UTF-8损坏的字符串)-->main(UTF-8损坏的字符串)
UTF-8-->Big5 设定-->?定</p>
我认为当参数传递给 JVM 时,该参数已经损坏。
eclipse 运行配置中的参数
eclipse运行配置中的VM参数
eclipse中常见的运行配置编码:UTF-8
java 源文件(CharsetARGTest.java) 编码字符集:UTF-8
CharsetARGTest.java
输出
python - pip 无法安装或升级,报告 UnicodeDecodeError
我在 Win10 中使用 anaconda Powershell Prompt。使用 pip(版本:21.2.4)安装包时报告 UnicodeDecodeError。我发现内核 Python 3.6.7 和 Python 3.9.7 都会报这个错误。安装和升级都失败,报同样的错误。我试过以下命令。
包可以是任何东西并报告相同的错误。
使用 Windows CMD 报告了相同的错误。我使用 Windows CMD 尝试了以下命令。
这是我得到的错误报告。
我已经重新安装了 pip、Anaconda 和 python 解释器。它仍然失败。我认为这与点子无关。输入流出现问题。默认解码格式为“GBK”。我尝试使用以下命令将解码格式更改为“utf-8”。它再次失败并出现同样的错误。
感谢@Mobfi 的建议,我尝试了其他类似的命令,它们返回相同的错误通知。
感谢@BoarGules 的建议,我用utf-8 解码器启动python 并尝试用pip 安装/升级包。
我在 powershell 中启动了 python 控制台。导入 pip pip.main(['install', 'simplejson'])
除了类似的回溯,我得到了另一个新的回溯:
有人可以帮忙吗?欢迎任何潜在的解决方案、线索或类似经验。