问题标签 [chardet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - UTF-8 编码文件被 chardetect 选为 ASCII
我正在编写一个组合文件夹中存在的所有文件的单个文件。我希望文本文件是 UTF-8 编码的。我的代码如下
当我使用 chardetect 查找我的编码时,它显示为 ASCII 有信心 1.0
请解决问题。谢谢
python - 使用 Chardet 查找超大文件的编码
我试图用Chardet
制表符分隔格式来推断一个非常大的文件(> 400 万行)的编码。
目前,我的脚本可能由于文件的大小而挣扎。我想将其缩小到加载文件的前 x 行,可能,但是当我尝试使用readline()
.
目前的脚本是:
它可以工作,但它只读取文件的第一行。我尝试使用简单循环readline()
多次调用的尝试效果不佳(也许是脚本以二进制格式打开文件的事实)。
一行的输出是{'encoding': 'Windows-1252', 'confidence': 0.73, 'language': ''}
我想知道增加它读取的行数是否会提高编码的信心。
任何帮助将不胜感激。
python - python chardet 无法正确检测到 utf-8
和结果
为什么它不能检测s
为 UTF-8?
为什么是ASCII?
这条线没用吗?# -*- coding: utf-8 -*-
Python新人,谢谢!
python - 软件包已安装但无法识别
我正在尝试在 Visual Studio 2017 15.6.2 上的 python 中使用 chardet 包
即使我安装了 chardet 包,它也无法识别。
什么可能是错的?
这是一个屏幕截图
https://i.imgur.com/AFaiaH7.png
如果我尝试运行,我会收到此异常
pip - 无法卸载 chardet
我一直在尝试使用 pip 卸载 chardet,但出现以下错误:
“无法卸载 'chardet'。这是一个 distutils 安装的项目,因此我们无法准确确定哪些文件属于它,这只会导致部分卸载。”
我的 pip 版本是 10.0.0,python 2.7.14,Ubuntu 14.04。
python - Python (pip) - RequestsDependencyWarning:urllib3 (1.9.1) 或 chardet (2.3.0) 与支持的版本不匹配
我找到了几个关于这个问题的页面,但没有一个能解决我的问题。
即使我做一个:
我得到:
我做了什么 :
但正如解释的那样,它给了我同样的错误。
所以我做了 :
并解除他所有的依赖。在我重新安装它之后 - >相同:'(
我对python-pip
. 重新安装后 - >相同。
以下是关于所需的版本urllib3
和chardet
版本: 摘录/usr/local/lib/python2.7/dist-packages/requests/__init__.py
:
我的版本是:
我没有更多的想法...
python - 我使用 chardet 测试编码,但出现错误
TypeError:预期的字节或字节数组类型的对象,得到:< class 'str'>
我只是从教程中输入代码。我真的无法弄清楚发生了什么错误。
python-2.7 - RequestsDependencyWarning:urllib3 (1.23) 或 chardet (2.3.0) 与支持的版本不匹配
当我尝试运行 cisco nxapi 代码时,出现以下错误。
/usr/local/lib/python2.7/dist-packages/requests/init .py:91: RequestsDependencyWarning: urllib3 (1.23) 或 chardet (2.3.0) 与支持的版本不匹配!
RequestsDependencyWarning) Traceback(最近一次调用最后一次):文件“NXAPI.py”,第 31 行,响应 = requests.post(url,data=json.dumps(payload), headers=myheaders,auth=(switchuser,switchpassword)) .json() 文件“/usr/local/lib/python2.7/dist-packages/requests/models.py”,第 896 行,在 json 中返回 complexjson.loads(self.text, **kwargs) 文件“/usr /local/lib/python2.7/dist-packages/simplejson/init .py ”,第 518 行,加载返回 _default_decoder.decode(s) 文件“/usr/local/lib/python2.7/dist-packages/simplejson /decoder.py”,第 370 行,在 decode obj 中,end = self.raw_decode(s) 文件“/usr/local/lib/python2.7/dist-packages/simplejson/decoder.py”,第 400 行,在 raw_decode返回 self.scan_once(s, idx=_w(s, idx).end()) simplejson.errors.JSONDecodeError:期望值:第 1 行第 1 列(字符 0)
请让我知道我该如何摆脱这个。
python-3.x - 安装 kiteconnect 3.7.4 时无法卸载“chardet”
我尝试使用 pip 安装 kiteconnect==3.7.4,它抛出错误“无法卸载 'chardet'。这是一个 distutils 安装的项目,因此我们无法准确确定哪些文件属于它,这只会导致部分卸载。 "
我还尝试使用 pip uninstall chardet 卸载 chardet,它会引发相同的错误。
我可以安装 kiteconnect==3.6.2,但是每当我尝试升级或安装新版本时,我都会收到此错误。
我的服务器详细信息 Amazon Linux AMI python 3.6.5
python-3.x - 如何检测文件格式的编码
我在 s3 的存储桶中有文件,我正在将它们作为流读取。我想检测不同文件的编码。
我使用了 chardet 库,我收到了这个错误:
我的代码是:
还有其他方法可以在打开文件之前检测编码吗