问题标签 [dbisam]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
29 浏览

python - 将 .dat 文件(DBISAM 表)读入 Pandas 数据帧时出现编码错误

提前感谢你们提供的任何帮助。

我正在尝试从 Retail Edge POS 软件生成的 .dat 文件(DBISAM 表)创建 Pandas 数据框。我的问题与此非常相似,当使用他们的代码时,我能够得到一个结果,而其他加载数据的努力完全失败了。

结果:
DF 形状:(31626, 115)
DF 尺寸:2
样本返回数据:0 É9☺ ♠¾Y#dË@=qÒã¼dÐ☺

在我用来查询存储数据的数据库系统实用程序中,根据我最近的检查,该表应该有 27 列和 39,310 行。

我使用 Chardet 尝试确定正确的编码,将其标识为 Windows-1254。当我将它换成 Latin-1 时,我得到一个不同的错误:'charmap' 编解码器无法解码位置 11 中的字节 0x8e:字符映射到 <undefined>

同样,当我换成 UTF-8 编码时:'utf-8' 编解码器无法解码位置 0 的字节 0xc9:无效的继续字节

我在 CSV 和 txt 文件上与 Pandas 一起工作过,但我觉得这里超出了我的深度。我也尝试过使用 StringIO 和 BytesIO 方法,但没有设法以有意义的形式检索数据。这是我为农民拥有的杂货店可视化库存和销售数据的第一步,所以我没有将专业的 IT/编码能力带到桌面上。我很感激任何建议。