问题标签 [chardet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - Chardet 未检测到编码
我想要一些来自具有以下 url 的网站的数据: http ://www.iex.nl/Ajax/ChartData/interday.ashx?id=360113249&callback=ChartData
我认为数据是Json。转到浏览器中的 url,我可以读取数据。
在python中,我有以下代码:
这给出了以下输出: {'confidence': 0.0, 'encoding': None}
当我打印 htmlfile 时,它看起来像是'utf8'。
chardet 输出的原因可能是什么?
ruby - rchardet gem 支持 ISO-8859-1 和 Windows-1252
我想知道 rchardet 是否支持 ISO-8859-1 和 Windows-1252 的编码。我已经看过文档,但我没有得到关于这方面的正确信息。
scala - www.wikipedia.org 上的 juniversalchardet 有缺陷
我正在尝试使用 juniversalchardet 自动检测已保存网页的编码,我的第一个测试使用 www.wikipedia.org,它根据 HTTP 响应标头使用 UTF-8 编码(此信息在保存到磁盘后丢失)
这是我这样做的scala代码:
但是,无论我加载什么,字符集结果始终为“空”,是因为 juniversalchardet 库有缺陷吗?还是我用错了?
python - exe文件说-无法导入名称chardet
我正在尝试exe
使用py2exe
. 问题是当我尝试运行创建的exe
文件时,它返回它无法导入名称 chardet。
我在程序的一个 py 文件中使用 requests 模块。
Setup.py
:
你知道问题可能出在哪里吗?有setup.py
文件吗?
编辑:这个问题只有一个答案:Stackoverflow answer,但我可能不明白。我的项目中没有名为 requests 的目录。
java - 检测 iso-8859-2 的 Java chardet
是否有检测 iso-8859-2 的 Python chardet 的 Java 版本?我已经尝试过 Mozilla universalchardet 和 jchardet 都没有工作,他们都猜到了 windows-1252 但 Linux 附带的 python chardet 检测到它就好了。
python - 尝试使用 chardet 猜测文件的编码
我正在编写一个适用于 CSV 文件的程序。这些文件可以有特定的编码。我正在尝试合并一个程序来尝试猜测用户想要使用 chardet 打开的文件的编码。
我正在尝试使用以下代码:
但我得到以下例外:
我也试过:
但是得到:
这是我试图打开的文件的一部分:
string - ZipFile 中的 namelist() 返回编码无效的字符串
问题在于,对于上传到 python 应用程序的某些档案或文件,ZipFile
'snamelist()
返回解码错误的字符串。
如何修复该代码,以便我始终以 unicode 解码文件名(因此支持 Chineeze、俄语和其他语言)?
我已经看过一些 Python 2 的示例,但由于字符串的性质在 python3 中发生了变化,我不知道如何重新编码它,或者在它上面应用 chardet。
python - Pandas 无法加载数据,csv 编码之谜
我正在尝试将数据集加载到熊猫中,但似乎无法通过第 1 步。我是新手,所以如果这很明显,请原谅,我搜索了以前的主题但没有找到答案。数据大多是汉字,这可能是问题所在。
.csv 非常大,可以在这里找到:http ://weiboscope.jmsc.hku.hk/datazip/ 我在第 1 周尝试。
在下面的代码中,我确定了我尝试的 3 种解码类型,包括尝试查看使用了哪种编码
任何帮助将不胜感激!
编辑:@Kristof 提供的答案确实有效,就像我的同事昨天整理的程序一样:
我还想为未来的搜索者补充一下,这是 2012 年的 Weiboscope 开放数据。
python - 如何在python中解码未知的编码字符串,尝试过chardet?
我不知道字符串的编码类型,我想解码那个字符串。我尝试过 chardetpython
模块但没有用。
我知道字符串的输出,无论如何我可以使用python解码字符串...
例子
任何帮助,将不胜感激
python - 尝试启动 Jupyter Notebook (Python) 时出现运行时错误
我通常在编写 Python 时使用 Jupyter Notebook 接口,但最近我通过 pip (Bioservices)安装了生物服务,当我尝试打开 Jupyter Notebook 时,出现以下运行时错误:
~$ jupyter 笔记本
回溯(最近一次通话最后):
PS:我卸载了bioservices并没有解决错误!试图重新安装 chardet 但它给出了下一个输出:
~$ pip install chardet==3.0.2
收集chardet==3.0.2
使用缓存的 chardet-3.0.2-py2.py3-none-any.whl
安装收集的包:chardet
成功安装chardet-2.3.0