1

我在读取具有重复名称的 2 列以上的羽毛格式的数据文件时遇到问题。是否可以在元数据级别删除重复名称或以某种方式加载具有重复名称的数据。

假设数据集“mtcars”保存在磁盘上并由

feather_metadata("mtcars")

[32 x 12]@mtcars

  • 'mpg' : 双倍

  • 'mpg' : 双倍

  • 'mpg' : 双倍

  • 'cyl' : 双

  • 'disp' : 双倍

通过使用"read_feather("mtcars")它会产生错误

错误:列名mpgmpg、 不得重复。使用 .name_repair 指定修复。

如何解决这个问题?

4

1 回答 1

1

这是我找到的解决方案 - 按列索引读取数据:

read_feather("mtcars", columns = c(1, 4, 5)

这允许传递重复的列。

于 2020-03-26T20:29:33.667 回答