问题标签 [chardet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
901 浏览

python-2.7 - Chardet 未检测到编码

我想要一些来自具有以下 url 的网站的数据: http ://www.iex.nl/Ajax/ChartData/interday.ashx?id=360113249&callback=ChartData

我认为数据是Json。转到浏览器中的 url,我可以读取数据。

在python中,我有以下代码:

这给出了以下输出: {'confidence': 0.0, 'encoding': None}

当我打印 htmlfile 时,它​​看起来像是'utf8'。

chardet 输出的原因可能是什么?

0 投票
1 回答
104 浏览

ruby - rchardet gem 支持 ISO-8859-1 和 Windows-1252

我想知道 rchardet 是否支持 ISO-8859-1 和 Windows-1252 的编码。我已经看过文档,但我没有得到关于这方面的正确信息。

0 投票
1 回答
213 浏览

scala - www.wikipedia.org 上的 juniversalchardet 有缺陷

我正在尝试使用 juniversalchardet 自动检测已保存网页的编码,我的第一个测试使用 www.wikipedia.org,它根据 HTTP 响应标头使用 UTF-8 编码(此信息在保存到磁盘后丢失)

这是我这样做的scala代码:

但是,无论我加载什么,字符集结果始终为“空”,是因为 juniversalchardet 库有缺陷吗?还是我用错了?

0 投票
0 回答
569 浏览

python - exe文件说-无法导入名称chardet

我正在尝试exe使用py2exe. 问题是当我尝试运行创建的exe文件时,它返回它无法导入名称 chardet。

我在程序的一个 py 文件中使用 requests 模块。

Setup.py

你知道问题可能出在哪里吗?有setup.py文件吗?

编辑:这个问题只有一个答案:Stackoverflow answer,但我可能不明白。我的项目中没有名为 requests 的目录。

0 投票
1 回答
418 浏览

java - 检测 iso-8859-2 的 Java chardet

是否有检测 iso-8859-2 的 Python chardet 的 Java 版本?我已经尝试过 Mozilla universalchardet 和 jchardet 都没有工作,他们都猜到了 windows-1252 但 Linux 附带的 python chardet 检测到它就好了。

0 投票
1 回答
3141 浏览

python - 尝试使用 chardet 猜测文件的编码

我正在编写一个适用于 CSV 文件的程序。这些文件可以有特定的编码。我正在尝试合并一个程序来尝试猜测用户想要使用 chardet 打开的文件的编码。

我正在尝试使用以下代码:

但我得到以下例外:

我也试过:

但是得到:

这是我试图打开的文件的一部分:

0 投票
3 回答
3785 浏览

string - ZipFile 中的 namelist() 返回编码无效的字符串

问题在于,对于上传到 python 应用程序的某些档案或文件,ZipFile'snamelist()返回解码错误的字符串。

如何修复该代码,以便我始终以 unicode 解码文件名(因此支持 Chineeze、俄语和其他语言)?

我已经看过一些 Python 2 的示例,但由于字符串的性质在 python3 中发生了变化,我不知道如何重新编码它,或者在它上面应用 chardet。

0 投票
1 回答
2656 浏览

python - Pandas 无法加载数据,csv 编码之谜

我正在尝试将数据集加载到熊猫中,但似乎无法通过第 1 步。我是新手,所以如果这很明显,请原谅,我搜索了以前的主题但没有找到答案。数据大多是汉字,这可能是问题所在。

.csv 非常大,可以在这里找到:http ://weiboscope.jmsc.hku.hk/datazip/ 我在第 1 周尝试。

在下面的代码中,我确定了我尝试的 3 种解码类型,包括尝试查看使用了哪种编码

任何帮助将不胜感激!

编辑:@Kristof 提供的答案确实有效,就像我的同事昨天整理的程序一样:

我还想为未来的搜索者补充一下,这是 2012 年的 Weiboscope 开放数据。

0 投票
1 回答
632 浏览

python - 如何在python中解码未知的编码字符串,尝试过chardet?

我不知道字符串的编码类型,我想解码那个字符串。我尝试过 chardetpython模块但没有用。

我知道字符串的输出,无论如何我可以使用python解码字符串...

例子

任何帮助,将不胜感激

0 投票
3 回答
2030 浏览

python - 尝试启动 Jupyter Notebook (Python) 时出现运行时错误

我通常在编写 Python 时使用 Jupyter Notebook 接口,但最近我通过 pip (Bioservices)安装了生物服务,当我尝试打开 Jupyter Notebook 时,出现以下运行时错误:

~$ jupyter 笔记本

回溯(最近一次通话最后):

PS:我卸载了bioservices并没有解决错误!试图重新安装 chardet 但它给出了下一个输出:

~$ pip install chardet==3.0.2

收集chardet==3.0.2

使用缓存的 chardet-3.0.2-py2.py3-none-any.whl

安装收集的包:chardet

成功安装chardet-2.3.0