问题标签 [feather]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

130 问题

0 投票

1 回答

111 浏览

r - 如何在 R 中读取带有重复列的羽毛文件

我在读取具有重复名称的 2 列以上的羽毛格式的数据文件时遇到问题。是否可以在元数据级别删除重复名称或以某种方式加载具有重复名称的数据。

假设数据集“mtcars”保存在磁盘上并由

给

[32 x 12]@mtcars

'mpg' : 双倍
'mpg' : 双倍
'mpg' : 双倍
'cyl' : 双
'disp' : 双倍

通过使用"read_feather("mtcars")它会产生错误

错误：列名mpg、mpg、不得重复。使用 .name_repair 指定修复。

如何解决这个问题？

r feather

2020-03-26T16:10:12.497

0 投票

1 回答

579 浏览

python - 我可以在不使用 R 的情况下将 .rda 文件转换为 python 中的 pandas 数据框吗？

我正在练习我的 Python，特别是我的 numpy 和 pandas。我有一些 .rda 格式的数据（不是我的），我想将它们作为数据框导入 python。但是我不使用 R，所以我想知道是否可以在不摆弄基本文件的情况下做到这一点。从我在网站上看到的情况来看，羽毛被推荐了，所以我尝试了以下方法：

但这会产生“ArrowInvalid：不是羽毛文件”错误，这听起来像是我必须先深入研究 .rda 文件并将其制成 .fea 文件，我不想像我想象的那样做d 必须安装 R。非常感谢提前。

python r pandas dataframe feather

2020-04-18T20:04:16.653

0 投票

2 回答

550 浏览

python - 使用python将excel转换为羽毛格式

我有一个（每天增长的）大约 100 个大 excel 文件的列表，我用 Python 对其进行分析。由于我必须对所有文件运行几个循环，我的分析变得越来越慢。因此，我想将所有 excel 文件转换为羽毛格式（比如每周一次）。有没有聪明的方法来做到这一点？到目前为止我已经尝试过：

但我收到以下错误消息：

python excel pandas feather

2020-05-06T14:43:38.240

0 投票

2 回答

374 浏览

python - pd.read_feather 小数/千位分隔符问题和浮点数舍入问题

我想使用 .ftr 文件快速分析数百个表。不幸的是，我在小数点和千位分隔符方面遇到了一些问题，类似于那篇文章，只是 read_feather 不允许decimal=',', thousands='.'选项。我尝试了以下方法：

导致

当我将其更改为

我在结果中收到了一些奇怪的（四舍五入）错误，例如 22359999999999998 而不是 2236 用于某些高于 1k 的数字。1k以下都是真实结果的10倍，这可能是因为删除了“。” 浮点数并创建该数字的整数。

试

也会导致结果中出现一些奇怪的行为，因为一些数字在 10^12 中，而另一些则保持在 10^3 中。

以下是我从多个 Excel 文件创建 .ftr 文件的方法。我知道我可以简单地从 Excel 文件创建 DataFrame，但这会大大降低我的日常计算速度。

我该如何解决这个问题？

编辑：问题似乎来自于以 df 格式读取 excel 文件，其中关于十进制和千位分隔符的非美国标准，而不是将其保存为羽毛。使用pd.read_excel(f, encoding='utf-8', decimal=',', thousands='.')读取 excel 文件的选项解决了我的问题。这就引出了下一个问题：

为什么在羽毛文件中保存浮点数会导致奇怪的舍入错误，例如将 2.236 更改为 2.2359999999999998？

python pandas rounding decimal-point feather

2020-05-20T09:30:42.860

0 投票

1 回答

2714 浏览